ade

php记录搜索引擎爬行记录的实现代码
<?php /** * 获取搜索引擎爬行记录 */ function get_naps_bot() {...
扫描右侧二维码阅读全文
06
2018/12

php记录搜索引擎爬行记录的实现代码

<?php

/**
 * 获取搜索引擎爬行记录
 */
function get_naps_bot()
{
    $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
    if (strpos($useragent, 'googlebot') !== false) {
        return 'Google';
    }
    if (strpos($useragent, 'baiduspider') !== false) {
        return 'Baidu';
    }
    if (strpos($useragent, 'msnbot') !== false) {
        return 'Bing';
    }
    if (strpos($useragent, 'slurp') !== false) {
        return 'Yahoo';
    }
    if (strpos($useragent, 'sosospider') !== false) {
        return 'Soso';
    }
    if (strpos($useragent, 'sogou spider') !== false) {
        return 'Sogou';
    }
    if (strpos($useragent, 'yodaobot') !== false) {
        return 'Yodao';
    }

    return false;
}

function nowtime()
{
    $date = date('Y-m-d.G:i:s');

    return $date;
}

$searchbot = get_naps_bot();

var_dump($searchbot); die;
if ($searchbot) {
    $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
    $url = $_SERVER['HTTP_REFERER'];
    $file = 'www.txt';
    $time = nowtime();
    $data = fopen($file, 'a');
    fwrite($data, "Time:$time robot:$searchbot URL:$tlc_thispage\n");
    fclose($data);
}

//记录搜索引擎爬行记录
// $searchbot = get_naps_bot();

// if ($searchbot) {
//     $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
//     $url = $_SERVER['HTTP_REFERER'];
//     $file = WEB_PATH.'api/robotslogs.txt';
//     $date = date('Y-m-d H:i:s');
//     $data = fopen($file, 'a');
//     fwrite($data, "Time:$date robot:$searchbot URL:$tlc_thispage/r/n");
//     fclose($data);
// }
最后修改:2018 年 12 月 06 日 09 : 23 PM
如果觉得我的文章对你有用,请随意赞赏
声明:本站部分资源收集于网络,仅供学习和测试,如果有侵权内容、不妥之处,请联系我们删除。敬请谅解!

发表评论

评论人工审核,请勿发表违规内容、无意义内容,请使用真实邮箱地址,方便接收评论回复及评论审核通知。

1 条评论

  1. 今日新闻

    文章不错非常喜欢