搜索引擎对结果的呈现,是由一系列复杂的算法、排序规则决定,并不是简单由“新发布的内容”决定。
我们先了解下百度搜索首页的结果通常是由什么信息组成的:
这也解释了为什么老板搜索关键词,一篇新发布的内容并不能马上出现在首页的问题。
1、 百度付费广告(竞价排名推广/展示广告)
2、 百度免费产品:百科、资讯流(原百度新闻)、熊掌号、百家号、知道、贴吧、百库、地图、图片、视频、音乐、电商聚合等
3、 机构/企业官网
4、 新闻网站发布的新闻资讯
5、 社交网站的UGC内容,包括微博、问答类网站(知乎)、论坛、博客、视频网站等
6、 招聘信息网站
7、 分类信息网站
如果内容紧贴热点,在百度新闻和网页时效性卡片中获得展示的机会越大。 百度在 2017 年 3 月宣布取消新闻源数据库时,其公告中强调的核心根源就是因为“时效性内容识别技术”的升级。
8、 电商购物网站(包括OTA在线旅行预订)
9、 股市行情(上市公司)
10、 其它相关网页信息
新闻网站发布的资讯新闻,新闻价值决定用户参与度,看的人越多,搜索结果推荐越靠前,越靠前用户点击越多,累积循环,这也解释了为什么多年前的负面新闻一直沉淀在百度首页,这就是典型的马太效应。
PC和移动端搜索除了设备和展示形式上的不同之外,前几种类型的内容会依次占据PC+移动首页搜索结果,排序不会有太多本质差别。除了百度付费广告和其产品外,自然搜索结果的排序主要由以下方面因素影响:
1、用户相关度
搜索引擎首先需要确保呈现结果与用户的搜索需求紧密相关,这里的相关度包括关键词在网页中出现的位置、频次(密度)。比如,企业官网包含的品牌和产品关键词最多,对于搜索引擎来讲,就是相关度最高的自然搜索结果推荐。
对于构成绝大多数自然搜索结果的资讯内容来说,关键词在正副标题、首段、正文中出现的位置、频次(合理的),对搜索引擎的相关度评判会有直接影响。在百度早期,内容与用户相关度的影响在搜索排序中的比重会占到七成。
以沃尔玛这篇新闻稿为例,核心关键词“沃尔玛”和“陈文渊”在标题和首段中分别出现六次和三次,在搜索结果中,相关度更高的网页就会优先推荐给用户。
再如,中国平安、华为、智慧城市为核心关键词,在标题和首段中的位置和频次得到保障,作为具有时效性的新闻事件,在百度网页和新闻搜索结果中推荐会更相关。
2、内容时效性
3、内容质量
所谓内容质量,也就是内容能为用户产生的价值,近一年来非常明显的一个趋势是,百度正在网页和新闻搜索结果中过滤掉没有时效性,或被算法判定为营销内容的结果,即便是内容发布门户网站上,也不会受到靠前的搜索结果推荐。
百度站方曾接受界面采访时提到,“我们有个部门在过去半年时间内一直在调教算法,针对所有百度抓取到的网页,教机器来判断时效性和内容质量,在前端展示上,一些软文会被过滤掉,其他的不会发生太大变化”。
4、用户参与度
所谓用户参与度,是指构成用户参与的行为有阅读、点击、转评赞等互动行为,这些指标也是构成百度资讯指数的基础。用户对网页内容的参与度越高,搜索引擎认为其重要程度和受欢迎程度越高,页面则更有机会展现给用户。
一般来讲,社交类UGC内容如知乎、豆瓣等,招聘信息、分类信息、电商信息、股市行情等,通常更新频度高,点击量大,搜索结果会靠前,但基本上是非品牌公关目的的功能性作用,如招聘、销售等目的。