洛阳谷歌-商品抓取常见问题
我们会定期抓取您的移动版和桌面设备版商品页面及商品图片,检查是否存在质量问题。如果无法进行抓取,我们就不能在Google购物中显示您的商品。另外,对于目标网页,如果我们在获取商品的移动版或桌面设备版目标网页时检测到抓取错误,就不会批准在移动设备和桌面设备上展示商品,直到我们能够成功访问目标网页为止。
商品抓取问题最常见的原因有:
“未找到网页 (404) ”错误:您提供的网址有误(例如网址拼写错误),因此网页返回“未找到网页 (404)”的错误。 请检查网址是否正确,以及您的网站是否存在。
服务器的robots.txt禁止访问:由于您在服务器中添加了robots.txt文件而使您的网页排除在外,因此我们无法对其进行抓取访问。我们不会抓取您用robot文件设置禁止抓取的网页。请配置robots.txt文件,允许我们抓取。
网址无效:您的网址包含无效字符或者不是有效的链接格式。
注意:在问题得到解决后,您的商品最多可能需要48小时才会重新出现在Google购物中。
此外,还有其他一些问题也可能会影响我们对您网页的抓取。
常见问题
网页需要身份验证:所提供的网址受到某种身份验证协议的保护,这会使Google无法访问网站内容。
HTTP 4xx响应、HTTP 5xx响应:您网站的托管服务器返回HTTP错误,阻止Google访问网站内容。
主机名无法解析:我们无法将您服务器的主机名解析为IP地址,因此无法访问网页。
HTTP响应格式不正确:来自您服务器的响应显示为乱码。
专用IP:您的网站被防火墙或路由器阻挡了,我们无法访问。
网络错误:网络中出现某种错误。
读取网页超时:服务器返回网页的时间过长,我们放弃了对该商品的抓取。
服务器重定向过于频繁:您的服务器多次对抓取进行重定向,我们只能放弃抓取。
重定向网址过长、重定向网址为空、重定向网址错误:您的服务器返回的重定向网址无效,我们无法进行跟踪。
服务器的robots.txt无法访问,读取robots.txt超时:我们无法读取您的robots.txt文件,因此无法抓取您的网页。请点击此处了解有关漫游器排除协议的详细信息。