作者文章归档:面对疾风吧

爬取电影天堂流媒体并整合


用到的包

#用于请求网页
import requests
#分别用于正则匹配、获取目录信息、字符串加载为字典
import re,os,json
#用于解析网页
from bs4 import BeautifulSoup as bs
#用于合并流媒体
from moviepy.editor import *
#用于获取随机的匿名IP
import random

初始化

#获取电影关键词
keyword = input('请输入关键词:')
#为电影创建目录
if not os.path.exists(keyword):
    os.mkdir(keyword)
#切换到专属

Read more

记录第五六周的C++作业


作业要求

/*用Visual Studio 编写一个MFC界面,功能如下:
一. 仿照RW编写一个界面,枚举本机PCI的信息。*/

RW界面

设计思路

首先打开VS2019,新建基于对话框的MFC控制台程序,点击资源文件,双击后缀为.rc的文件进入资源视图,在Dialog中选中面板,删除已有的三个组件,然后添加三个按钮(Button),一个下拉选择框(Combo Box),一个列表(List Contorl),一个次级面板(Tab Control)。如下所示:

代码部分

//主要修改末尾为Dlg的文件,其完整代码如下

// MFCApplication2Dlg.cpp: 实现文件
//

Read more

稳定婚姻问题的Python实现


问题描述

“稳定婚姻问题”在生活中是一个典型的问题,通俗地可叙述为:当前有N位男生和N位女生最后要组成稳定的婚姻家庭,过程开始之前男生和女生在各自的心目中都按照喜爱程度对N位异性有了各自的排序.然后开始选择自己的对象,其规则是:男生第一天均向各自最喜欢的女生写一封“情书”。

算法概述

1962年,美国数学家David Gale和Lloyd Shapley发明了一种寻找稳定婚姻的策略,人们称之为延迟认可算法(Gale-Shapley算法)。 先对所有男士进行落选标记,称其为自由男。当存在自由男时,进行以下操作: 1 每一位自由男在所有尚未拒绝她的女士中选择一位被他排名最优先的女士; 2 每一位女

Read more

使用python制作二维码


直接上代码

from MyQR import myqr
url = 'https://www.ljczero.top'
myqr.run(words = url,#目标url
         version = 5,#控制边长,范围1到40
         level = 'H',#控制纠错水平,[L,M,Q,H],从左到右依次升高
         picture = 'heart.gif',#将二维码与自定义图片结合
         colorized = True,#默认是黑白(False),True为彩色
         cont

Read more

记录第四周的C++作业


作业要求

/*
用Visual Studio 编写一个控制台程序,功能如下:
一、使用SMBIOS读取本机的MEMORY信息,并打印一下信息
[MEMORY]
NUM = 2
SIZE=32GB

[0]
LOCATOR=DIMM1
SIZE=16GB
TYPE=DDR4
SPEED=2666MHZ
MANUFACTURER=Micron

[1]
LOCATOR=DIMM1
SIZE=16GB
TYPE=DDR4
SPEED=2666MHZ
MANUFACTURER=Micron

注:可以参考RW上SMBIOS信息对照
*/

头文件

#pragma once //只编译一次,节省时间
/

Read more

Python连接MongoDB并进行一些简单操作


初始化

import pandas as pd
from pymongo import MongoClient
#从Excel中读取信息,不使用第一行作为索引
data = pd.read_excel('前程无忧python职位信息.xlsx',header = None)
#将第一行作为存入数据库时的索引
namespace = data.loc[0].tolist()

存数据

def save_mongodb():
    #设置了auth=True时这样连接
    client = MongoClient("mongodb://user:pwd@localh

Read more

记录第三周的C++作业


作业要求

"""
一、使用命令CPUInfo.exe -c 读取本机CPU的信息,并存储到INI格式的文本中:
示例如下:
[CPU]
Manufacturer=AuthenticAMD
BrandID=AMD Athlon Gold 3150U with Radeon Graphics
CPUID=0F81
Cores=2
HyperThread=True
MainClock=2396MHZ
L1CacheSize=192KB
L2CacheSize=1024KB
L3CacheSize=4096KB
二、使用命令CPUInfo.exe -r 读取INI文本中C

Read more

记一次探索ID3算法的过程


import pandas as pd
#import openpyxl
import math

#计算对数的方法,第二个参数代表底,或者直接用log2
#print(math.log(4,2))
#print(math.log(10))#此时代表自然对数

#使用openpyxl操作工作表
#wb = openpyxl.load_workbook('配眼镜.xlsx')
#ws_data = wb['Sheet1']
#删除第一行
#ws_data.delete_rows(1)
#header = None 不指定索引
df = pd.read_excel(

Read more

爬取前程无忧职位信息并数据可视化


写在前面

最近在学习爬虫和数据分析,在CSDN看到TRHX • 鲍勃的文章,受益匪浅,但是在爬取数据的时候,发现前程无忧使用了动态加载js,使用requests无法爬取部分数据,而且调用lxml解析网页变得比以前更难了,这里使用的反反爬就是selenium和re正则暴力匹配...bs4可能仅仅用于解决Unicode字符编码问题。

用到的包

#用于请求网页数据
import requests
#正则表达式、json字典
import re,json
#爬取过程中用于暂停
import time
#用于操作Excel
import openpyxl
#模拟真实用户获取职位信息总页数
from se

Read more