搜索引擎是怎么判断网站是否是原创内容的

admin 网站优化 2022-02-11 03:47:54 原创内容"

关于百度对于原创内容判断的分析

大量复制内容网站有的时候会影响关键字的排名。

比如说原本是你写的文章，本来应该排名很好，但是其他人抄袭或转载你的文章，而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话，你应有的排名就会被那个网页夺走。

那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢？可能有以下几个考虑：

1）网页PR值。网页PR值越高，被认为是原始版本的可能性就越大。

2）网页第一次被收录的时间。网页被搜索引擎收录的时候越早，相比后发现的相同内容的网页来说，被当作原始出处的可能性就越大。

3）域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

4）网站的权威度。这就有点说不清了，可能包含前面3个因素，还有很多其他因素。

但到目前为止，无论以哪一个因素为主，或怎样组合这些因素，都不可能完全正确从多个网页中挑出原始出处。

比如说我这个博客就很新，域名也很新，文章被收录的时间有的时候也不一定是最早的，就权威地位和被信任度来说，也肯定比不上很多中文网站。但我的博客新，我的域名新，并不意味着我的内容就不是原始出处，实际上我的所有博客都是原创。

我最近也发现了很多网站都转载，有的时候是抄袭我的博客内容，很多网站的规模，历史，PR值都比我的网站要高的多。

基于个人博客，谷歌更多给予内容权重

1、谷歌比百度收录更快，更能辨别原出处

今天网友有说，此前我写的一文，谷歌的搜索结果中，原文出去就是我的博客地址，排在第一位。

其实，谷歌对于中文信息抓取速度之快，我早有切身感受。使用火狐浏览器以来，安装了谷歌工具条，默认的搜索引擎就是谷歌。自己也常常就新写的博客日志进行搜索，发现谷歌收录的速度很快，有时半小时就可以收录

按照曾经的理解，百度应该对中文更加偏好，不过从搜索自己博客内容来看，其实不然。百度一方面是收录速度慢，再就是不愿意够辨别是否原出处。还是上面提到的博客日志，9月12日发布的，时至今日，我的博客地址还是不能够在百度搜索结果的首页出现。

这个原因，不知道是我使用的z-blog博客程序不受百度欢迎，还是百度太懂得中文了，对于我这个博客的质量提不起兴趣。按说z-blog对于搜索引擎很友好的，许多做搜索引擎优化的博客，使用的都是该程序。而如果说我的博客质量不高，但毕竟是原出处，而且同样的日志，出现在别的网站，为什么就能够获得一个较高的权重。

对于以上，由于自己太过非专业，只是对看到的现象，做一些可能的思考。两个搜索引擎对于中文博客日志如何考虑，以及搜索引擎本身技术如何，实在难有明了。不过可以肯定的是，博客日志，包括个人网站，内容能够对谷歌迅速收录，当是一件喜事。相对应的，百度对于中文内容，或者整个网络信息，收录之慢，已是很明显的事实。不知，百度的更懂中文，更懂在哪里。

在检测文章原始出处方面，Google做的比较好，基本上能够正确判断，百度做的就比较差。从我的文章在不同的地方出现的情况看，百度似乎认为域名比较老的就是原创。

2、百度新闻比谷歌资讯更胜一筹

以上是对百度和谷歌搜索的一点浅析。新闻资讯方面，百度新闻和谷歌资讯，结果则恰恰相反。

个人感觉百度新闻一是内容丰富，再就是收录速度很快。自己的多个博客日志被一些新闻网站转载后，时间不长，就能够出现在百度新闻里。当然，同样的内容，如果是在博客里，百度决计不会搭理的。

谷歌资讯，算是自己使用的很少的谷歌产品了。感觉谷歌资讯相比百度新闻，效果很低。一是内容很少，不像百度，相关信息的下级页面，看起来像是一个专题。二是速度更新慢，不像百度新闻有时候几分钟就可以收录。再就是谷歌资讯对来源网站的要求更高，一般都是官方媒体或者一些门户网站，百度则显得不拘一格。

稍微概括一下。谷歌收录中文信息比百度快很多，谷歌对于原文出处能够进行较好的辨别并给予不错的权重，新闻资讯方面，百度则比谷歌资讯更胜一筹

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。
本文地址：/yunying/SEO/114655.html

上一篇 : 网站优化SEO原理和网站推广方式

下一篇 : 如何增加SEO效果的3个做法

留言与评论（共有 0 条评论）

1000元配置

2000元配置

3000元配置

4000元配置

5000元配置

6000元配置

7000元配置

8000元配置

9000元配置

万元配置

i3配置

i5配置

i7配置

APU配置

R5配置

R7配置

游戏攻略

软件教程

Win10教程

Win7教程

Mac教程

Linux教程

U盘教程

Server教程

搜索引擎是怎么判断网站是否是原创内容的

版权声明

热门文章

最近发表

标签列表

| 桂ICP备2023010378号-4

Powered By EmpireCMS

搜索引擎是怎么判断网站是否是原创内容的

版权声明

相关文章

热门文章

最近发表

标签列表

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?1cc50873f5e983e8073d99a425b87921"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); | 桂ICP备2023010378号-4

Powered By EmpireCMS

| 桂ICP备2023010378号-4