用HDWIKI做了一个
生物百科站,没想到被GOOGLE K了,想不出来什么原因。后来查了下 ,目前能做的就是去掉百科联盟采集过来的词条中的超链接。互动百科很保守,大图是采集不下来的,链接还是到互动百科的主站,这样词条中就有大量的HDWIKI HREF链接。想做个实验试试,把这些超链接删除后,谷歌会不会重新光顾我的生物百科。
工具:ULTRAEDIT-32 可以用通配符替换
前期准备:登录PHPMYADMIN, 导出WIKI_DOC这个表,因为大小的限制,一次只能导出1000条左右,大小不能超过10M, 否则到时上传的时候会超时不成功。导出的SQL文件可以用ULTRAEDIT32打开。替换所有文件中的含TUPIAN.HUDONG.COM这样的超链接。本来想用HDWIKI5.0后台自带的数据库备份,但因为备份出来的SQL文件有乱码,也许是因为我的空间是在美国服务器的原因。只能采用分段备份的办法,还是很折腾。
替换过程:这里举个例子:<DIV class="img img_r"><A title=点击查看原图
href="http://tupian.hudong.com/a1_51_56_01300000346385123537564802460_jpg.html"
target=_blank><IMG title=(图)丁酸酐
alt=(图)丁酸酐
src="http://a1.att.hudong.com/51/56/01300000346385123537564802460_s.jpg"
></A><STRONG>丁酸酐</STRONG></DIV>
那要替换的语句就这样写:<DIV class="img img_r"><A title=* href="http://tupian.hudong.com/*>
后期工作:再把数据库中的WIKI_DOC删除,上传所有替换过的SQL文件,大功告成!静候谷歌的再次收录!
警告:一定要先备份你的数据库,再执行这样的操作!