首页 > 其他 > 详细

搜狗搜索公众号内容提取

时间:2015-01-06 15:53:56      阅读:305      评论:0      收藏:0      [点我收藏+]

搜狗搜索公众号内的文章,默认是特殊的json格式,无法用于wp_autopost采集,提取了一下。

<?php 
$url = "http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFtzSR_4RbC1QpdwrVLTEkxJk&page=1&t=1420517379862"; 
$ch = curl_init(); 
curl_setopt ($ch, CURLOPT_URL, $url); 
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,100);

$dxycontent = curl_exec($ch); 
//echo $dxycontent; 

$str = $dxycontent;
$kw = "php";

preg_match_all(‘/http:\/\/([.a-zA-Z0-9_&=?\/]*)#rd/‘,$str,$mat);
//var_export($mat);
//die();
?>
<html>
<head>太虚讲堂微信</head>
	<body>
<?php

for($i=0;$i<count($mat[0]);$i++){
	echo ‘<a href="‘.$mat[0][$i].‘">weixin{$i}</a><br />‘;
}
	//    echo $str;
?> 	
	</body>
</html>


搜狗搜索公众号内容提取

原文:http://my.oschina.net/jianhui1980/blog/364271

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!