帝国cms在防止内容采集方面做的工作

  • A+
所属分类:帝国cms技巧

该内容于1302天前发布,其中信息可能已经过时,请注意分辨。

在某论坛偶然看到有讨论帝国CMS关于防止复制和防止采集方面的内容。于是下载了一份学习一下。


首先找到了相关函数的定义位置:

防止复制

防止复制函数 e/class/connect.php的第3176行(这里就不贴具体效果了。)

//加上防复制字符
function AddNotCopyRndStr($text){
	global $public_r;
	if($public_r['opencopytext'])
	{
		$rnd=make_password(3).$public_r['sitename'];
		$text=str_replace("<br />","<span style=\"display:none\">".$rnd."</span><br />",$text);
		$text=str_replace("</p>","<span style=\"display:none\">".$rnd."</span></p>",$text);
	}
return $text;
}

可以看到原理很简单,是把换行和p标签的结束标签替换成<span style="display:none">随机三位字符+站点标题</span><br />。不过为什么这么做,我没有查找到相关资料。只看到2011年已经有相关的文章了。

防止采集

e/class/functions.php第3767行,这块有相关功能说明 http://www.phome.net/EmpireCMS/edu/base/66.html

function ReturnNotcj($string){
	global $notcj_r,$notcjnum;
	if(empty($notcjnum))
	{
		$rep="";
    }
	else
	{
		$i=rand(1,$notcjnum);
		$rep=$notcj_r[$i];
    }
	$cjword="<!--ecms.*-->";
	$string=str_replace($cjword,$rep,$string);
	return $string;
}

也可以很轻易的看出,是把文章输出模板中的 <!--ecms.*--> 替换成我们自己在后台定义的防止采集字符。默认有以下内容:

<input type=hidden value='欢迎使用帝国网站管理系统:www.phome.net'>
<phome 帝国网站管理系统,phome.net>
<!--帝国CMS,phome.net-->
<table style=display=none><tr><td>

<div style=display=none>

这块就比较好理解了,市面上采集多采用元素选择器或者正则进行内容获取,可以把 这些不可显示的内容(html注释、标签)一并获取到。以进行一个对采集内容的混淆。


对,就是这样~

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin