OpenNLP
Apache OpenNLP庫是一個基於機器學習的自然語言文本處理的開發工具包,它支持自然語言處理中一些共有的任務,例如:標記化、句子分割、詞性標注、固有實體提取(指在句子中辨認出專有名詞,例如:人名)、淺層分析(句字分塊)、語法分析及指代。這些任務通常都需要較為先進的文字處理服務功能[1] [2]。
開發者 | Apache軟件基金會 |
---|---|
首次發布 | 2004年4月22日 |
當前版本 | 2.3.0(2023年8月3日 | )
源代碼庫 | |
編程語言 | Java |
操作系統 | 跨平台 |
類型 | 自然語言處理 |
許可協議 | Apache許可證第二版 |
網站 | opennlp |
參考資料
- ^ Apache OpenNLP Website. [2012-04-20]. (原始內容存檔於2012-04-13).
- ^ Apache OpenNLP Proposal. [2012-04-20]. (原始內容存檔於2012-04-19).
參看
- 非結構化信息管理架構(Unstructured Information Management Architecture,UIMA)
- 一般文字工程架構(General Architecture for Text Engineering,GATE)
- cTAKES