- 写了简易爬虫
- 修改了博客主题
- 写了个 bing 每日图片 api
- 7/7 天熬夜晚睡,昨天我妈看见我惊讶极了,我一照镜子,我感觉我病入膏肓了
- 背单词划水 5/7 天
爬虫
上一周爬了好几个网站,用 Python,PHP 写了好几个简易的爬虫。主要爬到图片 5w 张左右。另外就是,多方爬取,爬到 bing 的每日壁纸,2345 张,从 2016 年 3 月 5 日 到 2022 年 8 月 5 日,刚好 2345 天,对应 2345 张图片。
成果:
- bimg.jieis.cn 打开默认显示今天的 bing 壁纸。
- bimg.jieis.cn/bing/20220801 显示 20220801 日的 bing 壁纸
- bimg.jieis.cn/rand 随机显示 2016 年至今的任意一张图片
比如,今天的 bing 图片是:
修改了博客主题:
但是,目前为止,并没有在这个博客使用,之前两个星期写了一个脚本利用 GitHub Action 来同步博客,刚写好没几天,我就重构了一下,这周又改主题…..
关键是,前两天我发现博客园偷偷改版了,挺好使的现在。而且,我才发现,我之前在博客园也发了一些博客,比我想象的多…..我以为和我 CSDN 一样光杆。
而且,我惊讶的发现自己是自己最讨厌的人,我每次看博客都会骂排版,失效…..当我回顾我的博客园的时候,我不由得骂了起来,再一看是自己写的
另一个就是,我发现我当年学了好多 C语言 的东西,天哪,我都忘了,想当初熬夜写了这么多,我要是不发博客,我真不知道我还学过这个点。
本周编程小点:
- bash 中替换字符串的引号
- bash 文本去重
- bash …… 更多看 “2022-31周-bash-使用技能”
- Python 中使用多行匹配
Python 中使用正则表达式匹配多行时,需要加 re.S 参数,例:运行结果将如下所示:1
2
3
4
5
6
7
8
9
10
11
12
13import re
s = '''
"obj" : {
"obj0": 1,
"obj1": 2
}
'''
# 假设我们有这样的字符串,我们需要使用正则匹配出 obj 的值。
r = re.findall('"obj" : {(.*)', s)
print(r)
r = re.findall('"obj" : {(.*)', s, re.S)
print(r)1
2['']
['\n "obj0": 1,\n "obj1": 2\n }\n '] - Python 中进行 URL 编码与解码结果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36from urllib import parse
#数据对象
data = {
"a":"1",
"b":"3",
"x":"张三",
"y":"李四"
}
#进行url_encode编码,编码结果为查询字符串形式,即进行url编码,然后用a=1&b=2形式拼接键值对
text = parse.urlencode(data)
print("urlencode Dict: \t" + text)
#进行url解码,但是不会将拼接形式转换为字典形式
text1 = parse.unquote(text)
print("unquote String: \t" + text1)
#进行url编码,但是这步会将&与=一起转码
text2 = parse.quote(text1)
print("quote Dict: \t" + text2)
a = "我是大侦探"
#url编码
b = parse.quote(a)
print("quote String: \t" + b)
#url解码
c = parse.unquote(b)
print("unquote String: \t" + c)1
2
3
4
5urlencode Dict: a=1&b=3&x=%E5%BC%A0%E4%B8%89&y=%E6%9D%8E%E5%9B%9B
unquote String: a=1&b=3&x=张三&y=李四
quote Dict: a%3D1%26b%3D3%26x%3D%E5%BC%A0%E4%B8%89%26y%3D%E6%9D%8E%E5%9B%9B
quote String: %E6%88%91%E6%98%AF%E5%A4%A7%E4%BE%A6%E6%8E%A2
unquote String: 我是大侦探
Author: 哒琳
Permalink: http://blog.jieis.cn/2022/2f0ca947-bb91-43e4-9de6-6fa35737ae93.html
Comments