很多站长、博主可能最在乎的就是自己的网站的搜录情况,一般情况下我们可以通过查看空间的日志文件来看搜索引擎的爬行记录,不过,很不直观,所以我就改了一下同事给我的一个记录爬行记录的程序,是比较好又比较直观方便操作的!可以获取爬虫的ip,记录下他访问的路径!

效果:

以前的这个程序不能使用,不过我做了一下改动,可以获取爬虫的ip,记录下他访问的路径和时间,并且可以筛选,优化了一下清空表记录!感觉还是很不错,原理是什么呢?就是每个访客访问一个网站的时候都是会带有头信息的,蜘蛛和爬虫其实也是访客,只不过他们会抓取你网页的内容。我们就通过php来获取他的头信息就可以了。程序下载链接:http://l4.yunpan.cn/lk/QkPBdYTxeadZU 效果预览:http://www.521php.com/zhizhu 核心代码:

安装的时候

执行

 

http://您的域名/zhizhu/install

填写相应的配置信息即可自动完成安装

调用

在需要统计的PHP页面加入如下代码即可

<?php include ‘zhizhu/zz.php’;?>

如果你要想在静态页面调用,可以用<script scr=”/zhizhu/zz.php”></script>也是可以的,js也是可以引入php的

本文链接:http://www.521php.com/archives/996/

程序本天成,妙手偶得之!我们只是代码的搬运工!

转载请注明:http://www.521php.com/archives/996/?replytocom=840

目前有4 条留言

  1. 2013年01月14日 下午 12:47 Joken   |  引用  |  #1     

    师哥,有个问题想要请教,我的域名因为必须备案,但是我推迟了两个月,所以域名还没有真正地解析,只是临时的解析了一个,能够访问,这样的话百度会收录吗?

    • 2013年01月14日 下午 5:17 地狱中仰望天堂   |  引用  |  #2     

      你是说空间商给了一个临时的可以访问的域名对吧,那个是服务商的二级域名,如果你提交这个路径,原理上可以收录,但是一般情况下服务商都已经加了限制,你要收录,当然还是收录自己的域名啊!

  2. 2013年06月12日 上午 1:32 永恒   |  引用  |  #3     

    代码中include_once ‘config.php’是指的那个文件啊!是数据库的配置文件吗?现在我正需要一个爬虫程序来从其他网站爬数据然后插入数据库中。config.php中的代码只是为了连接数据吗?希望得到你的回复和帮助!谢谢!

    • 2013年06月13日 上午 10:21 地狱中仰望天堂   |  引用  |  #4     

      对,是数据库配置文件,上面有下载链接,可以直接安装的,不过我听你的意思好像是做采集吧,其实你可以用现有的采集程序采集后,再将数据转入你的程序,这个转入程序可以自己来写,其实也就是分析下采集程序的表结构,然后读取出采集的数据,再插入到你自己程序的数据库中

发表评论

昵称:

网址:

eg.博客主题调用的是Gravatar头像,你可以通过邮箱注册获得头像.
/ 快捷键:Ctrl+Enter