关于联系方式加密的疑惑

查看 81|回复 6
作者:leaveeel   
看到不少帖子在需要进一步交流的时候会提供通过 base64 加密的手机/微信/QQ/email/...我在顺手解码后得到的就是上述联系方式的完整字符串,极少数会加盐后编码。这就导致你的 base64 编码并没有起到增强隐私的作用,而通过真实联系方式加密后直接就能搜索出回复过该编码的帖子。
在仅仅是防止爬虫骚扰的情况下,对一些只爬手机号、email 的可能有效。现在大多留的是微信,我不清楚微信有没有加好友的 api ,即使有在调用之前尝试解码也不费事,手机、邮箱也可以在不需要额外人工的情况下尝试解码后进一步骚扰,和明文区别已经不大了。
而如果加盐后再编码就能很大程度解决这个问题,比如:
v2ex 微信号 ABCD
=> djJleOW+ruS/oeWPt0FCQ0Q=
+括号内微信( ABCD)
=> K+aLrOWPt+WGheW+ruS/oe+8iEFCQ0Qp
两个编码都能用于指向同一个微信,也能加大其他个人信息和这次编码产生联系的成本。但是这么做的人不多。
cmdOptionKana   
其实都泄漏得差不多了,我觉得没必要整复杂,直接暴露原文就行。
leaveeel
OP
  
@cmdOptionKana 现在普遍是原文加密的字符串,尤其是技术论坛。个人觉得这种粗暴的加密多此一举,没法保证隐私也给其他人增加操作,防君子不防小人了。
cmdOptionKana   
@leaveeel 我觉得就是赶时髦而已,形式主义大于实际意义。
llxvs   
1. 爬虫可以区分邮箱、手机号、普通文本的 base64 吗?退一步讲,爬虫可以区分 base64 与其他文本吗?
2. base64 可以防止搜索引擎收录,防止根据邮箱/手机号等搜索到你的帖子,尤其是对于不能删帖的本论坛来说。
leaveeel
OP
  
@llxvs 不知道但实际不需要知道,只要爬到的格式非手机邮箱的字母数字符号组合就可以尝试 decode 。
而第二点我在正文提到过,搜索引擎同样会收录 base64 码,不经过处理的号码和编码是一一对应的,想查依然能查到。
oneisall8955   
我习惯 pastebin
您需要登录后才可以回帖 登录 | 立即注册

返回顶部