PHP + Jieba (结巴)中文分词-菜鸟文章 - IT菜鸟
文章推薦指數: 80 %
PHP + Jieba (结巴)中文分词. ... 设置PHP运行占用内存(最少500M) ... require_once "/path/to/your/vendor/multi-array/MultiArray.php"; 菜鸟首页>文章中心>正文 PHP+Jieba(结巴)中文分词 发布时间:2021-06-1009:18 人气:283 更新时间:2021-06-1009:18 来源:网络 #此部分为通用加载 //设置PHP运行占用内存(最少500M)ini_set('memory_limit','1024M'); #下载zip压缩文件require_once"/path/to/your/vendor/multi-array/MultiArray.php";require_once"/path/to/your/vendor/multi-array/Factory/MultiArrayFactory.php";require_once"/path/to/your/class/Jieba.php";require_once"/path/to/your/class/Finalseg.php"useFukuball\Jieba\Jieba;useFukuball\Jieba\Finalseg;Jieba::init();Finalseg::init();点击跳转致下载链接示例:echo"
";$seg_list=Jieba::cut("结巴中文分词:做最好的中文分词!");var_dump($seg_list);echo"";$seg_list=Jieba::cut("结巴分词-全模式分词",true);var_dump($seg_list);#全模式echo"
";$seg_list=Jieba::cut("默认就是精确模式",false);var_dump($seg_list);#默认精确模式echo"
";$seg_list=Jieba::cutForSearch("搜索引擎模式,会将这句话分词成功类似搜索引擎的模式");#搜索引擎模式var_dump($seg_list);echo"
";##关键词提取 require_once"../src/class/JiebaAnalyse.php";useFukuball\Jieba\JiebaAnalyse;JiebaAnalyse::init();//越小精确度越高|提取的关键词越准|默认20$top_k=10;//读取luric.txt文件中的中文字符,进行提取$content=file_get_contents("../src/dict/lyric.txt","r");$tags=JiebaAnalyse::extractTags($content,$top_k);var_dump($tags);##导入自定义的词库 jieba::loadUserDict("../src/dict/user_dict.txt");//导入自定义的词库//接下来的词库中就会有你导入的词库$seg_list=Jieba::cut("结巴中文分词:做最好的中文分词!");var_dump($seg_list);##导入自定义词库并提取关键词 //实例化:第一个参数表示开启测试模式dict表示读取small词库,如果是繁体需要改成bigJieba::init(array('mode'=>'test','dict'=>'small'));Finalseg::init();JiebaAnalyse::init();jieba::loadUserDict("../src/dict/user_dict.txt");//导入自定义的词语//越小精确度又高|提取的关键词越准|默认20$top_k=10;$content=file_get_contents("../src/dict/lyric.txt","r");//这里是定义截断性比重占比分析JiebaAnalyse::setStopWords('../src/dict/stop_words.txt');//调用方法分析词语的占比$tags=JiebaAnalyse::extractTags($content,$top_k);echo"";var_dump($tags); 转载请注明出处:IT菜鸟(http://www.itrookie.com/article/details.html?id=125) 1 0 上一篇 下一篇 相关文章 PHP快速查找或判断目标值或键是否存在于数组并返回键值 PHP杂项函数中的pack与unpack PHParray_merge合并数组 PHP排序 PHP+Jieba(结巴)中文分词
延伸文章資訊
- 1PHP + Jieba (结巴)中文分词-菜鸟文章 - IT菜鸟
PHP + Jieba (结巴)中文分词. ... 设置PHP运行占用内存(最少500M) ... require_once "/path/to/your/vendor/multi-array/...
- 2實用PHP+jieba(結巴)中文關鍵字提取 - 台部落
jieba(結巴)中文分詞jieba(結巴)中文分詞是目前國內一款較好的中文分詞插件。 1.兼容當前絕大部分流行開發語言,例:Java、C/C++、PHP、Ios、 ...
- 3Laravel 中使用PHP 分词库(jieba) 和(scws) - LearnKu
laravel中使用php分词库(jieba)和(scws) 坚持开源,坚持分享这篇文章旨在介绍我用过的两个PHP分词库以及他们的简单使用目的:完成一段段落的分词1.Jieba分词库Jieba分...
- 4实用PHP+jieba(结巴)中文关键字提取 - CSDN博客
jieba(结巴)中文分词是目前国内一款较好的中文分词插件。 1.兼容当前绝大部分流行开发语言,例:Java、C/C++、PHP、Ios、 Node.js 等开发语言。
- 5fukuball jieba-php - ReleaseEye
結巴"中文分詞:做最好的PHP 中文分詞、中文斷詞組件。 / "Jieba" (Chinese for "to stutter") Chinese text segmentation: buil...