PHP + Jieba (结巴)中文分词-菜鸟文章 - IT菜鸟

文章推薦指數: 80 %
投票人數:10人

PHP + Jieba (结巴)中文分词. ... 设置PHP运行占用内存(最少500M) ... require_once "/path/to/your/vendor/multi-array/MultiArray.php"; 菜鸟首页>文章中心>正文 PHP+Jieba(结巴)中文分词 发布时间:2021-06-1009:18 人气:283 更新时间:2021-06-1009:18 来源:网络 #此部分为通用加载  //设置PHP运行占用内存(最少500M)ini_set('memory_limit','1024M'); #下载zip压缩文件require_once"/path/to/your/vendor/multi-array/MultiArray.php";require_once"/path/to/your/vendor/multi-array/Factory/MultiArrayFactory.php";require_once"/path/to/your/class/Jieba.php";require_once"/path/to/your/class/Finalseg.php"useFukuball\Jieba\Jieba;useFukuball\Jieba\Finalseg;Jieba::init();Finalseg::init();点击跳转致下载链接示例:echo"

";$seg_list=Jieba::cut("结巴中文分词:做最好的中文分词!");var_dump($seg_list);echo"
";$seg_list=Jieba::cut("结巴分词-全模式分词",true);var_dump($seg_list);#全模式echo"
";$seg_list=Jieba::cut("默认就是精确模式",false);var_dump($seg_list);#默认精确模式echo"
";$seg_list=Jieba::cutForSearch("搜索引擎模式,会将这句话分词成功类似搜索引擎的模式");#搜索引擎模式var_dump($seg_list);echo"
";##关键词提取  require_once"../src/class/JiebaAnalyse.php";useFukuball\Jieba\JiebaAnalyse;JiebaAnalyse::init();//越小精确度越高|提取的关键词越准|默认20$top_k=10;//读取luric.txt文件中的中文字符,进行提取$content=file_get_contents("../src/dict/lyric.txt","r");$tags=JiebaAnalyse::extractTags($content,$top_k);var_dump($tags);##导入自定义的词库 jieba::loadUserDict("../src/dict/user_dict.txt");//导入自定义的词库//接下来的词库中就会有你导入的词库$seg_list=Jieba::cut("结巴中文分词:做最好的中文分词!");var_dump($seg_list);##导入自定义词库并提取关键词 //实例化:第一个参数表示开启测试模式dict表示读取small词库,如果是繁体需要改成bigJieba::init(array('mode'=>'test','dict'=>'small'));Finalseg::init();JiebaAnalyse::init();jieba::loadUserDict("../src/dict/user_dict.txt");//导入自定义的词语//越小精确度又高|提取的关键词越准|默认20$top_k=10;$content=file_get_contents("../src/dict/lyric.txt","r");//这里是定义截断性比重占比分析JiebaAnalyse::setStopWords('../src/dict/stop_words.txt');//调用方法分析词语的占比$tags=JiebaAnalyse::extractTags($content,$top_k);echo"
";var_dump($tags);

转载请注明出处:IT菜鸟(http://www.itrookie.com/article/details.html?id=125)





1



0











上一篇





下一篇







相关文章
PHP快速查找或判断目标值或键是否存在于数组并返回键值
PHP杂项函数中的pack与unpack
PHParray_merge合并数组
PHP排序
PHP+Jieba(结巴)中文分词































請為這篇文章評分?