跟百度出来创业的朋友聊了一下午,我特嘛的麻了!!

查看 63|回复 10
作者:站长老六   
(我以前是搞开发的,12、13年的时候在北京一家软件公司的同事,后来人家跳槽到新浪微博,又跳到京东,最后留在了百度...... 而我,为了安逸选择了中小型公司)
24年大约十月份一个以前的同事从百度离职了,正式开始创业了,他有优势,以前在百度搜索算法边缘岗任职。今天跟这朋友聊的核心主要下边几个:
百度算法到底有没有逻辑性,有多大?
他说,当然有逻辑性,他们部门虽说是算法边缘位置,但是他多少也了解一些,他们的算法中心很大,具体多少人不清楚,每个部分都是只干自己的事情,互相不干涉,结构也很复杂,很多工种只是写文档,从搜索用户需求出发,写文档,写完文档开研讨会,如果文档有进一步的可能,那就会进入下一个需求池子,具体下一个池子是哪个部门、哪个人负责根本不知道。
百度算法的逻辑相当复杂,这也是问什么百度大更新时站长们都肝颤的原因,因为谁都不清楚到哪个环节、哪个流程就会咔掉一大堆站,然后算法到某个评估环节后又蹭蹭的涨。
跟朋友聊完后,我大概整理了一下,我也只能整理一个逻辑,因为具体的算法 我这个朋友都摸不清楚。
抓取算法大概流程(主要以新站说)
新站上线后,百度获取新站的方法
1.主动提交给百度
2.通过所谓的蜘蛛、机器人爬取(友链方式)
3.有人搜索了这个域名
4.BA信息
5.域名实名信息
核心就这几种获取新站的方式,但是有1点很重要,即便百度知道有你这个新站上线了也不会立即就主动去抓取,后边的内容会讲原因,我这哥们说光跑这些业务的机器就有几千台。
对于咱们新站尤其是国内的新站来说主动提交、友链、BA 这几个动作都很重要、非常重要,这就是抓取环节的逻辑性。
怎么提高百度抓取的可能性?有没有捷径?
答案:有,但是我这朋友也只能说个大概,因为他太边缘了。(也有可能人家知道不告诉我)
新站评估的方式很多,这哥们接触到的有以下几个逻辑点
1.社会关系复杂的优先抓取(例如新站上线就有很多友链)(又或者上线后就有几十万、上百万的搜索需求的)
2.上流社会的优先收录(例如上线后就有百度、淘宝、京东等等各大平台的友链)
3.内容为王,就是内容多,更新速度越快给予的蜘蛛份额越足。(但是一直提供垃圾、重复内容,蜘蛛一般都会断崖式下滑,直至为0)
4.是否有价值,就是说即便你内容很多、更新也很频繁,对于百度来说没价值,也不会给你好脸色,18年以前百度的算法是不能很好的识别内容的,后来搜索算法融入了ai,这个痛点至少解决了80%,也就是说现在百度能精准的识别出是不是垃圾、重复内容。
5.最核心的来了,例如有一篇文章,百度能精准的识别出这个标题、内容是不是解决了用户搜索的需求,会对每一个网页进行精准的评分
例如用户搜索的需求是:今天吃什么
摆在百度面前的有几千几万几百万的网页在等着筛选,A网页给出的内容是十道菜的做法,B网页给出的是50道菜的做法,C网页给出的是5道菜的做法并且还给出了这5道菜的订餐方法,
那这时候百度还会根据这个搜索的人历史行为进行判断,例如这个人在百度的维度里是一个宝妈,平时经常会做饭,所以百度有70%的概率会给她推A跟B,还有30%的概率会给她推C,因为百度的算法里加入了AI,会根据各种维度去判断这个宝妈是不是不想做饭了,是不是该订餐吃一顿了。
我靠,当时跟我哥们聊到这里的时候,我都震惊了,TMD百度会琢磨人心了........... 有点恐怖............
这段总结你们自己来吧.....
上边内容都是说的抓取,并没有说收录哦! !!! 意思就是说咱们搞了个新站,人家百度前期还真不一定鸟你的内容......
怎么才能提高收录?有没有快速收录的方法?
答案:有
想要提被百度收录必须要满足以下几点:
1.满足上边说的,让百度知道你,比如(提交网址、友链等)
2.内容至少要有搜索需求(大概意思就是说,比如有人会搜索:iphone手机最新款,而你的内容就是介绍iphone手机最新款的)
3.你的内容与别人的内容有优势,例如:搜索“iphone手机最新款”排第一的是一个中关村在线,中关村在线已经有很深厚的背景及丰富的内容了,他的内容打8分,而你的内容通过各种规则算法评估后有9分,这时候你肯定被收录,如果有4分则会先被索引,然后在经过一段时间各个维度的算法评估有可能被放出来,有可能永远不被放出来
4.这个网页TMD居然会经常更新,收录他。这就是说的好多人做垂直站,例如人家首页的标题就是“iphone手机最新款”,人家的核心内容就是介绍手机的,这就是往往垂直站排名会占优势的原因
5.即便你的内容很差,但是我还是会时不时的翻一翻你的牌子,因为对百度来说翻你的牌子没多大成本,如果不翻你的牌子导致你断更了,至少对百度来说是个损失。百度时不时的翻我们的牌子还有一个原因,就是累计咱们日常所说的权重积分,举个通俗易懂的例子吧,搜索某个词出来的第一位可能不是啥正牌网站,而你是个正牌网站,但是我大百度谁知道你啊,但是通过友链(很多官方网站都指向你)、BA等各种原因我后期经过数据分析,慢慢发现好像你这个沙雕才是正牌网站,原来排第一的那个2B是个冒牌的,这时候百度就慢慢把你给提上来了,收录的内容也就越来越多了。
怎么才能有排名?有没有快速的方法?
答案:有
上边说了很多,多少也讲到了一些排名的规则,下边是我这个朋友说的:
要想有排名,首先得有收录,上边也说了像提交网址、友链、BA等。
在百度内部,其实排名算法更庞大,庞大到经常TMD出现BUG,比如一个老站、有内容、有历史、有身份,TMD照样给你干崩溃,但是百度的排名算法有后手。
例如排名规则有1000条线或规则去评估,我这次更新的是第50-99条规则,我他喵的新规则上线第二天后直接把京东给干没影了......别着急,我后边第500-550条规则是补救措施,我这500-550条规则的内容是把(京东、头条、小A、小B)等等关系户准备的,到第五天就给他们恢复,当我新规则上线后直接把一群小站长干没了,别着急,我第900-950条规则是补救的,我会在这50条规则里对你们重新进行判断,看看有没有必要给你们恢复。当百度调整的是后边的规则例如950-1000条规则,那好,把你干没了,那你就真没了.... ....
上边就是大概百度每次大更新的大概流程,那怎么来提高排名呢?
【快速排名】找到需求,并且对于百度来说是空白的,这个东西在TMD百度内部居然有人干过,好像直接被他喵的关小黑屋了,意思就是百度内部有这个数据,但是一般人拿不到,不过我估计很多数据分析的平台也能分析出来。
【积分制】例如有一个站是做iphone手机分析的(我们称这个站叫A),而你也新做了一个iphone手机分析网站(你的站是B),A站做了十年了,内容有百万条,加入十年是10分,百万内容是100分,一共满足了10个人的搜索需求算10分(我们就只拿最基本的规则举例,像内容评分这些我们就不说了,因为这哥们都他喵的讲不明白),我们就当这个网站在百度的总分数是120分,你的站是新站,站龄0分,内容有1万条算10分,从未满足过用户搜索需求0分,那么你这个B站就绝对没排名,但是如果你一直很稳定并且A站一个外链都没有(假设),而你有十条非常稳定的友链,那百度就会每天给你加0.01的友链分,当有一个用户搜索了一个iphone相关的内容,你这B站有答案而A站没答案,这时候这个搜索需求就是你的了,当你这B站慢慢从各个维度超过了A站的时候,从内容更新、满足需求、友链等等各个维度你都超越了A站,那你这个B就绝对比那个A权重高了。
跟这个哥们聊了不少内容,大概就是这么个意思,我曹聊完后我都他喵的灰暗了,这他妈的做站越来越难了,我感觉咱们4414的站长捆在一起也干不过百度啊!!!!!
兄弟,你们打算啥时候转行 .............. 我特嘛的 真麻了 ........

内容, 算法

站长老六
OP
  

他喵的,我现在做站能想到的就是抓数据、买友链、发外链,其他的感觉无能为力了.........
ioio   
学习了....斑猪进来射精吧
站长老六
OP
  
ioio 发表于 2025-1-1 21:22
学习了....斑猪进来射精吧

又遇到你小子,你赶紧转行吧,我不想看到这么优秀的你 ........
爱说说   
别在一棵树上吊死。。何况这棵树自己都快倒了。
站长老六
OP
  
爱说说 发表于 2025-1-1 21:33
别在一棵树上吊死。。何况这棵树自己都快倒了。

关键是,他喵的 我都没抱过树呢.......

数据多   
应该自绝屏蔽百度少给它ai贡献数据
爱说说   
站长老六 发表于 2025-1-1 21:36
关键是,他喵的 我都没抱过树呢.......

网站除非还有钱赚,没有就先不要更新了。
尝试一下,短视频,跨境电商。。
路走通了,跟网站一样赚钱。
DRS   
他喵的,我现在做站能想到的就是抓数据、买友链、发外链,其他的感觉无能为力了.........
报业登报网   
原创 原创 还是TMD原创,搞死百度
您需要登录后才可以回帖 登录 | 立即注册

返回顶部