jieba-tw - 結巴中文斷詞台灣繁體版本 - GitHub
文章推薦指數: 80 %
結巴中文斷詞台灣繁體版本. Contribute to APCLab/jieba-tw development by creating an account on GitHub. Skiptocontent {{message}} APCLab / jieba-tw Public forkedfromldkrsi/jieba-zh_TW Notifications Fork 6.6k Star 64 結巴中文斷詞台灣繁體版本 License MITlicense 64 stars 6.6k forks Star Notifications Code Issues 0 Pullrequests 0 Actions Projects 0 Wiki Security Insights More Code Issues Pullrequests Actions Projects Wiki Security Insights APCLab/jieba-tw Thiscommitdoesnotbelongtoanybranchonthisrepository,andmaybelongtoaforkoutsideoftherepository. master Branches Tags Couldnotloadbranches Nothingtoshow {{refName}} default Couldnotloadtags Nothingtoshow {{refName}} default 2 branches 23 tags Code Thisbranchis13commitsaheadofldkrsi:master. Contribute Thisbranchis13commitsaheadofldkrsi:master. Openapullrequesttocontributeyourchangesupstream. Openpullrequest Latestcommit Gitstats 501 commits Files Permalink Failedtoloadlatestcommitinformation. Type Name Latestcommitmessage Committime jieba Mergeremote-trackingbranch'fxsjy/master' Oct31,2017 test Mergeremote-trackingbranch'fxsjy/master' Oct31,2017 .gitattributes firstcommit Sep29,2012 .gitignore newreadme Jul15,2016 Changelog Mergeremote-trackingbranch'fxsjy/master' Oct31,2017 LICENSE addalicensefile Jul29,2013 MANIFEST.in includeChangelog&README.mdinthedistributionpackage Jul29,2013 README.md revisingreadme May4,2017 setup.py bugfix Nov3,2017 Viewcode jieba-tw 原理 安裝 使用 斷詞 其餘注意事項 README.md jieba-tw 結巴(jieba)斷詞台灣繁體特化版本 原理 採用和原始jieba相同的演算法,替換其詞庫及HMM機率表製做出針對台灣繁體的jieba斷詞器 安裝 pipinstallgit+https://github.com/APCLab/jieba-tw.git 使用 本專案特化部分如下 importjieba jieba.case_sensitive=True#可控制對於詞彙中的英文部分是否為casesensitive,預設False 斷詞 importjieba #如果您的電腦同時要使用兩個版本的jieba,請自訂cache檔名,避免兩個cache互相蓋住對方 #jieba.dt.cache_file='jieba.cache.new' seg_list=jieba.cut("新竹的交通大學在新竹的大學路上") print("/".join(seg_list)) #新竹/的/交通/大學/在/新竹/的/大學路/上/ 其餘操作請參考結巴官方文件 其餘注意事項 參考ldkrsi版本之說明 About 結巴中文斷詞台灣繁體版本 Resources Readme License MITlicense Stars 64 stars Watchers 13 watching Forks 6.6k forks Releases 23 tags Packages0 Nopackagespublished Languages Python 51.9% OpenEdgeABL 48.1% Youcan’tperformthatactionatthistime. Yousignedinwithanothertaborwindow.Reloadtorefreshyoursession. Yousignedoutinanothertaborwindow.Reloadtorefreshyoursession.
延伸文章資訊
- 1Python jieba 中文斷詞套件 - 大學生's Blog
jieba中文斷詞套件. 结巴中文分词. https://github.com/fxsjy/jieba. 交大資管開發的結巴(jieba)斷詞台灣繁體特化版本.
- 2斷詞結構介紹&安裝結巴· Shopee Hackathon - JimCurry
pip install jieba. 由於預設的詞庫為簡體中文,故我們另外自行安裝繁體中文版的詞庫,將檔案放置剛才安裝好的路徑下: Ex:(勿複製此路徑) C:\users\angel.lee(...
- 3中文斷詞
目前繁體中文斷詞系統有中研院CKIP 以及jieba,在一些舊的文章中都提到jieba 無法適當地處理繁體中文,而有替換繁體中文字典的改進作法,不過 ...
- 4ldkrsi/jieba-zh_TW: 結巴中文斷詞台灣繁體版本 - GitHub
jieba-zh_TW. 結巴(jieba)斷詞台灣繁體版本. 原理. 採用和原始jieba相同的演算法,替換其詞庫及HMM機率表製做出針對台灣繁體的jieba斷詞器. 使用說明.
- 5Python – (11) 利用jieba實現中文斷詞 - 珍妮佛的學習筆記
中文斷詞畢竟跟英文不同,英文只要用空白(space)斷詞即可,中文卻複雜的多,目前中文斷詞大家蠻推的JIEBA…