【官方说法】全面解读BaiduSpider与站点死链

从最近几周收到的提问看,大家对死链越来越关注,毕竟死链直接关系到网站的抓取收录和流量转化。于是我们整合了学院之前的内容,又专门对Baiduspider工程师进行了咨询,给大家一个完整的系列答复。 问:robots屏蔽对阻止百度抓取死链是否有效 答:当然有效,百度严格遵守robots协议,若发现百度依然抓取,先确认是否为Baiduspider,若确认,可以通过反馈中心进行投诉。 参考链接:《如何识别 …

Read more

【官方说法】百度对网页内容大小和字符有要求吗?

VIP大讲堂微信群内有同学问:我们有一个网页3000多行中文+英文,快照显示不完整,通过站长平台模拟抓取(注:这位同学指的是抓取诊断工具),文字也显示不完整,对网站影响会不会很大?院长把这个笼统的问题拆成了小问题,并向工程师进行了确认。 第一个问题:百度对网页内容多少大小有限制吗? 答:对内容文字多少没有限制,但源码大小上有一定的限制,过长的话,会取前面一部分,所以,源码还是越简洁越好 第二个问题 …

Read more

【官方说法】robots文件是否支持中文目录

有同学问百度站长学院一个关于robots的问题:我们有个站点的目录结构使用的是中文,这样式儿的:www.a.com/冒险岛/123.html,那在制作robots文件和sitemap文件的时候,可以直接使用中文吗?百度能获取到吗?在实际操作中我们发现,sitemap中有文件是可以生效的,但robots封禁貌似没有反应,所以想确认一下:robots文件是否支持中文? 工程师解答:Baiduspide …

Read more

【官方说法】百度蜘蛛抓取流量暴增的原因

Spider对网站抓取数量突增往往给站点带来很大烦恼,纷纷找平台想要Baiduspider IP白名单,但实际上BaiduSpider IP会随时变化,所以并不敢公布出来,担心站长设置不及时影响抓取效果。百度是怎么计算分配抓取流量的呢?站点抓取流量暴增的原因有哪些呢? 总体来说,Baiduspider会根据站点规模、历史上网站每天新产出的链接数量、已抓取网页的综合质量打分等等,来综合计算抓取流量, …

Read more

资讯页不收录,原来是抢发惹的祸

里约奥运会结束了,资讯站点的小编们终于可以松口气了,可有些SEOer却高兴不起来:编辑辛苦抢先制作的原创稿件,百度却不!收!录!院长奥运会期间接到了四五起这样的反馈,经追查,原来是站点的抢发行为不够友好,导致spider抓取失败。结论: 1,页面制作完成后再放到spider可以发现的地方,这样才能达到最好的抓取效果。 2,页面未对外公开之前,千万不要通过工具推送给百度呀。 接到站长反馈后,院长联系 …

Read more

第二十节:网站图片优化技巧

图片的直观性明显优于文字,用户通过读图可以在最短时间内就判断出页面主旨,进而快速进入内容详情页面。一直很多做SEO的站长通过各种渠道向百度站长平台询问百度图片搜索收录排序的问题,百度图片搜索希望收录和展现的图片应具有以下三个维度的特点: 一,图片所在网页维度 1、图片所在网页主题与网站经营方向、主题一致。百度图片搜索认为,与网站主题一致的网页会受到站长的更多重视,其页面上的图片更可信 2、图片周边 …

Read more

什么是站点索引量?如何使用百度索引量工具?

什么是站点索引量 站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。 站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。 目前site语法的数值是索引量估算值,比较不准。推荐站长们使用我们的新工具,同时我们也正在努力改进site语法。 如何使用百度索引量工具 第一步,注册并登录百度站长平台; 第二步,提 …

Read more