2022-31周

周记
Article Directory
  • 写了简易爬虫
  • 修改了博客主题
  • 写了个 bing 每日图片 api
  • 7/7 天熬夜晚睡,昨天我妈看见我惊讶极了,我一照镜子,我感觉我病入膏肓了
  • 背单词划水 5/7 天

爬虫

上一周爬了好几个网站,用 Python,PHP 写了好几个简易的爬虫。主要爬到图片 5w 张左右。另外就是,多方爬取,爬到 bing 的每日壁纸,2345 张,从 2016 年 3 月 5 日 到 2022 年 8 月 5 日,刚好 2345 天,对应 2345 张图片。

成果:

比如,今天的 bing 图片是:
bingbing

修改了博客主题:

但是,目前为止,并没有在这个博客使用,之前两个星期写了一个脚本利用 GitHub Action 来同步博客,刚写好没几天,我就重构了一下,这周又改主题…..

关键是,前两天我发现博客园偷偷改版了,挺好使的现在。而且,我才发现,我之前在博客园也发了一些博客,比我想象的多…..我以为和我 CSDN 一样光杆。

而且,我惊讶的发现自己是自己最讨厌的人,我每次看博客都会骂排版,失效…..当我回顾我的博客园的时候,我不由得骂了起来,再一看是自己写的

另一个就是,我发现我当年学了好多 C语言 的东西,天哪,我都忘了,想当初熬夜写了这么多,我要是不发博客,我真不知道我还学过这个点。

本周编程小点:

  • bash 中替换字符串的引号
  • bash 文本去重
  • bash …… 更多看 “2022-31周-bash-使用技能”
  • Python 中使用多行匹配
    Python 中使用正则表达式匹配多行时,需要加 re.S 参数,例:
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    import re
    s = '''
    "obj" : {
    "obj0": 1,
    "obj1": 2
    }
    '''
    # 假设我们有这样的字符串,我们需要使用正则匹配出 obj 的值。
    r = re.findall('"obj" : {(.*)', s)
    print(r)

    r = re.findall('"obj" : {(.*)', s, re.S)
    print(r)
    运行结果将如下所示:
    1
    2
    ['']
    ['\n "obj0": 1,\n "obj1": 2\n }\n ']
  • Python 中进行 URL 编码与解码
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    from urllib import parse

    #数据对象
    data = {
    "a":"1",
    "b":"3",
    "x":"张三",
    "y":"李四"
    }
    #进行url_encode编码,编码结果为查询字符串形式,即进行url编码,然后用a=1&b=2形式拼接键值对
    text = parse.urlencode(data)

    print("urlencode Dict: \t" + text)

    #进行url解码,但是不会将拼接形式转换为字典形式
    text1 = parse.unquote(text)

    print("unquote String: \t" + text1)

    #进行url编码,但是这步会将&与=一起转码
    text2 = parse.quote(text1)

    print("quote Dict: \t" + text2)


    a = "我是大侦探"

    #url编码
    b = parse.quote(a)

    print("quote String: \t" + b)

    #url解码
    c = parse.unquote(b)

    print("unquote String: \t" + c)
    结果:
    1
    2
    3
    4
    5
    urlencode Dict:         a=1&b=3&x=%E5%BC%A0%E4%B8%89&y=%E6%9D%8E%E5%9B%9B
    unquote String: a=1&b=3&x=张三&y=李四
    quote Dict: a%3D1%26b%3D3%26x%3D%E5%BC%A0%E4%B8%89%26y%3D%E6%9D%8E%E5%9B%9B
    quote String: %E6%88%91%E6%98%AF%E5%A4%A7%E4%BE%A6%E6%8E%A2
    unquote String: 我是大侦探

Author: 哒琳

Permalink: http://blog.jieis.cn/2022/2f0ca947-bb91-43e4-9de6-6fa35737ae93.html

Comments