分类标签归档:数据分析

Python仿制腾讯大数据星云图


写在前面

带伙可以先看下腾讯的图,非常漂亮


腾讯位置大数据星云图


再看看本文代码绘制的图,逼格降低99%



但是轮廓还是有的对吧!!!!话不多说,我们开始吧!

用到的包

import re
import requests
import json
from fake_useragent import UserAgent
import pandas as pd
import numpy as np
from shapely.geometry import Point
from shapely.geometry.polygon import Polygon
from pyecharts.ch

Read more

抓取高途课堂课程和教师信息


写在前面

笔者偶尔参加了高途课堂的辅导老师面试,当时也没做什么准备,被HR问懵逼了,对公司也没做什么了解,自己的职业规划也不清楚,过去的经历一问也三不知,临走还把自己简历要了回去,以前我绝对是不敢厚着脸皮做这种事情的,只能说入职半年有进步。我更像是去闹着玩的,实际上我就是闲的了,我一开始就知道自己不适合做这种有销售性质的工作,太久不参加面试想练练手,给我投递橄榄枝的这位HR就成了我的“工具人”,如果HR本R读到这篇文章,且让我给您道个歉,顺便说一句,对于您问我“工作环境是什么”这件事我颇有微词。这篇文章就让我尝试了解一下高途课堂吧,抓一下他们的课程和教师信息。

直接上代码

我觉得没有必要写面向

Read more

抓取B站评论并可视化


写在前面

最近一位很火的央视美女主持,没错,说的就是王冰冰,入驻B站啦,她在2020年的最后一天发布了一条vlog,疯狂涨粉200w,成功跻身2020百大up,那么B站的网友们在评论区说了什么呢?让我们一起来看看吧!

思路分析

B站评论接口如下:


https://api.bilibili.com/x/v2/reply


参数有:

#固定值,可省略
'jsonp':'jsonp'
#固定值,不可缺省
'type':'1'
#评论页数
"pn":1
#排序方式,2代表从旧到新,1代表从新到旧,默认为1
'

Read more

Python连接MongoDB并进行一些简单操作


初始化

import pandas as pd
from pymongo import MongoClient
#从Excel中读取信息,不使用第一行作为索引
data = pd.read_excel('前程无忧python职位信息.xlsx',header = None)
#将第一行作为存入数据库时的索引
namespace = data.loc[0].tolist()

存数据

def save_mongodb():
    #设置了auth=True时这样连接
    client = MongoClient("mongodb://user:pwd@localh

Read more