Skip to content

Latest commit

 

History

History
62 lines (44 loc) · 1.98 KB

README.md

File metadata and controls

62 lines (44 loc) · 1.98 KB

pyltp

PyPI Status Readthedocs Build Status Build status PyPI Downloads

pyltp 是 语言技术平台(Language Technology Platform, LTP)的 Python 封装。

在使用 pyltp 之前,您需要简要了解 语言技术平台(LTP) 能否帮助您解决问题。

一个简单的例子

下面是一个使用 pyltp 进行分词的例子

# -*- coding: utf-8 -*-
from pyltp import Segmentor
segmentor = Segmentor()
segmentor.load("/path/to/your/cws/model")
words = segmentor.segment("元芳你怎么看")
print "|".join(words)
segmentor.release()

除了分词之外,pyltp 还提供词性标注、命名实体识别、依存句法分析、语义角色标注等功能。

详细使用方法请参考 在线文档

安装

  • 第一步,安装 pyltp

    使用 pip 安装

     $ pip install pyltp
    

    或从源代码安装

     $ git clone https://github.com/HIT-SCIR/pyltp
     $ git submodule init
     $ git submodule update
     $ python setup.py install
    
  • 第二步,下载模型文件

    百度云,当前模型版本 3.3.1

版本对应

  • pyltp 版本:0.1.9
  • LTP 版本:3.3.2
  • 模型版本:3.3.1

作者