服务报价 | 域名主机 | 网络营销 | 软件工具| [加入收藏]
 热线电话: #
当前位置: 主页 > php教程 > 其他 >

phpnow等php环境可以让apache记录蜘蛛等spider信息

时间:2013-04-08 05:02来源:未知 作者:最模板 点击:
在本地测试程序,大家一般都用wamp,xampp,最模板比较喜欢用phpnow,主要是全买了界面,不占用多少内存很方便。若是应用于服务器当中,有时候要看日志,默认phpnow日志是不记录user ag

 在本地测试程序,大家一般都用wamp,xampp,最模板比较喜欢用phpnow,主要是全买了界面,不占用多少内存很方便。若是应用于服务器当中,有时候要看日志,默认phpnow日志是不记录user agent的。

如: 

  1. 121.98.85.163 - - [19/Jul/2013:16:46:31 +0800] "GET / HTTP/1.1" 200 15342 "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; 360SE)"   

类似这种格式的日志,包含访客ip,来访时间,访问方式,访客user_agent等必备要素,已经属于最精简的格式了.如果是蜘蛛来访也可以看的一清二楚. 
如下百度蜘蛛: 

  1. 218.30.103.37 - - [08/Apr/2013:04:56:55 +0800] "GET /a/50606.html HTTP/1.1" 301 331 "-" "Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)" 

那么在apache当中是如何设置呢,以下以phpnow 为例.

1.  全局可以记录user agent 也就是可以记录spider信息。

打开http.conf文件 查找CustomLog logs/access.log common ,在前面加上#号,再查找CustomLog logs/access.log combined ,把前面的#号去掉。重启apache,打开php\Apache2\logs\access.log文件,这时蜘蛛爬行痕迹就会出现:

2.  单站点蜘蛛agent记录

很简单,找到文件 httpd-vhosts.conf

在站点配置那 ,改成这样

  1. <VirtualHost *> 
  2.     <Directory "D:/zuimoban.com"> 
  3.         Options -Indexes FollowSymLinks 
  4.         Allow from all 
  5.         AllowOverride All 
  6.     </Directory> 
  7.     ServerAdmin admin@ecshop.co 
  8.     DocumentRoot "D:/zuimoban.com
  9.     ServerName zuimoban.com:80 
  10.     ServerAlias www.zuimoban.com 
  11.     ErrorLog logs/zuimoban.com-error_log  
  12.     CustomLog logs/zuimoban.com-access_log combined 
  13.     php_admin_value open_base_dir "D:\zuimoban.com;C:\WINDOWS\Temp;" 
  14. </VirtualHost> 

注意 CustomLog logs/zuimoban.com-access_log combined  这里的意思。

 

(责任编辑:最模板)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
热点内容