一、简介正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执...
XPath 运算符
XPath 运算符XPath 表达式可返回节点集、字符串、逻辑值以及数字。XPath 运算符下面列出了可用在 XPath 表达式中的运算符:运算符描述实例返回值|计算两个节点集//book ...
TF-IDF模型关键词抽取
模型:gensim工具包TF-IDF模型维基百科语料数据(30万词条)利用jieba分词,加入行业词,去除停止词下面用维基百科中文数据来做测试1.数据预处理1.1 数据集采用分好词的维基百科中文数据,...
TF-IDF与余弦相似性的应用(三):自动摘要
作者: 阮一峰日期: 2013年3月26日有时候,很简单的数学方法,就可以完成很复杂的任务。这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算...
TF-IDF与余弦相似性的应用(二):找出相似文章
作者: 阮一峰日期: 2013年3月21日上一次,我用TF-IDF算法自动提取关键词。今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他...
TF-IDF与余弦相似性的应用(一):自动提取关键词
作者: 阮一峰日期: 2013年3月15日这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphra...
Apache服务的安装与卸载
我们产品的安装版本中是默认带Apache2.2,然后一位同事去前场,不小心又安装了一个Apache,还卸了。结果,本身的的那个Apache都跑不起了了。这时候,一定不能慌。问题,是绝对有办法解决的。首...
MySQL注射的过滤绕过技巧
SQL注射的绕过技巧较多,此文仅做一些简单的总结。前文已经提到,最好利用的注射点: 支持Union 可报错支持多行执行、可执行系统命令、可HTTP Request等额外有利条件若非...
OSCP经验分享
一、OSCP简介安全技术类的证书有很多,像是CEH, Security+, CISSP等等。除了众多侧重于笔试的安全认证,OSCP(Offensive Security Certified Profe...
远程控制软件njRAT v0.7
A great remote administrator tool with good features and very stable.一款伟大的远程管理工具,具有良好的功能和非常稳定的。下载:ht...