珍爱生命，不懂就问，_brief 后面这个 brief 是正则表达 ...

作者：maxwell29 发布时间：2023-6-24 14:02:00

今天在分析 rsshub 的源码，看到下面这一句：
const matches = response.data.match(/images/(\d{4}-\d{2}/\d{2})/\d{2}/\d+_brief/);
我能知道这个是一个正则表达式，但是_后面接的那个 brief ，实际替代的是一个_pdf.pdf,这个 brief 是正则表达式的内容吗？我查了一些资料没有搞明白，正则表达式没有这个关键词吧？
麻烦路过的兄弟指个方向，卡壳太难受了。

brief, 表达, PDF, tch

相关帖子

blankmiss 2023-6-24 14:02:46

这种东西让 chatgpt 回答就可以了
```
这段代码是在使用正则表达式（ regular expression ）匹配字符串中的特定模式。具体来说，它会在 response.data 字符串中查找符合以下规则的子字符串：
子字符串以 "images/" 开头，后面跟着一个形如 "yyyy-mm/dd" 的日期格式，例如 "2021-05/01"。
日期格式后面跟着 "/dd"，表示日期中的日，其中 dd 是一个两位数字，例如 "01"。
子字符串以一个或多个数字结尾，中间跟着 "_brief"。
如果在 response.data 中找到符合上述规则的子字符串，它就会被存储在 matches 变量中。matches 变量是一个数组，包含所有匹配到的子字符串及其匹配到的子表达式（如果有的话）。在这种情况下，matches[0] 包含整个匹配到的子字符串，而 matches[1] 则包含日期部分的子字符串。
```

maxwell29

OP

2023-6-24 14:03:28

@blankmiss
这一句话
“子字符串以一个或多个数字结尾，中间跟着 "_brief"。”怎么理解？
代码的效果最后没有_brief,而是_pdf.pdf ，
这个 brief 是指后面接着任何短语吗？

maxwell29

OP

2023-6-24 14:04:17

@blankmiss 它实际运行出来的结果是这个 /images/2023-06/23/A1/20230623A1_pdf.pdf

blankmiss 2023-6-24 14:05:04

自己找个 gpt 问一问不就好了

geelaw 2023-6-24 14:05:52

那个表达式不是
/images/(\d{4}-\d{2}/\d{2})/\d{2}/\d+_brief/
而是
/images\/(\d{4}-\d{2}\/\d{2})\/\d{2}\/\d+_brief/
缺少 \ 会导致语言把 /images/ 理解为一个正则表达式，从而出错。
提问的时候应该链接上下文，单看一句是很难看懂的。这段代码位于
https://github.com/DIYgod/RSSHub/blob/457e8f8a41c80bbd251bf40da2dd25648270a37f/lib/v2/hnrb/index.js#L24
假设 id 是空，这里的代码先 GET https://hnrb.voc.com.cn/hnrb_epaper 然后查找响应内容里面 URL=(.*)" 匹配中对应 .* 的结果，自己访问一下这个页面发现 URL=(.*)" 会匹配 <meta equiv="http-refresh" 里面的重定向地址，因此这个 GET 是为了得到最新地址。
第二步是 GET 这个最新地址，然后用正则表达式匹配得到的是 <img src=../../../images/2023-06/24/01/2023062401_brief.jpg 里面的 images/... 的内容，第一组的内容是 2023-06/24 （这个结果当然是随着时间变化的）。
所以并不存在你说的从正则表达式直接到 _pdf.pdf 这一步，它后面还对返回数据进行了各种加工。

珍爱生命，不懂就问，_brief 后面这个 brief 是正则表达式的什么关键字吗？

相关帖子

浏览过的版块

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

珍爱生命，不懂就问，_brief 后面这个 brief 是正则表达式的什么关键字吗？

相关帖子

浏览过的版块

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告