Skip to content

Commit ac62076

Browse files
committed
modify changelog and readme
1 parent 57ef504 commit ac62076

File tree

2 files changed

+31
-12
lines changed

2 files changed

+31
-12
lines changed

ChangeLog.md

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -4,6 +4,8 @@
44

55
1. 完善一些特殊字符和字母串的切词效果。
66
2. 提高关键词抽取的速度。
7+
3. 提供用户自定义词典的接口。
8+
4. 将server相关的代码独立出来,单独放在`server/`目录下。
79

810
## v2.4.0
911

README.md

Lines changed: 29 additions & 12 deletions
Original file line numberDiff line numberDiff line change
@@ -8,10 +8,9 @@ CppJieba是"结巴"中文分词的C++版本
88

99
## Feature
1010

11-
+ 源代码都写进头文件hpp里`include`即可使用。
11+
+ 源代码都写进头文件`src/*.hpp``include`即可使用。
1212
+ 支持`utf-8, gbk`编码,但是推荐使用`utf-8`编码。
13-
+ 内置分词服务,在linux环境下可安装使用。mac因为没有自带`epoll`,使用示例请看[libcppjieba]
14-
+ [libcppjieba] 最简单易懂的CppJieba头文件库使用示例。
13+
+ 内置分词服务`server/server.cpp`,在linux环境下可安装使用。
1514
+ 项目自带较为完善的单元测试,核心功能中文分词的稳定性接受过线上环境检验。
1615
+ 支持载自定义用户词典。
1716

@@ -96,7 +95,11 @@ cat install_manifest.txt | sudo xargs rm -rf
9695

9796
## Demo
9897

99-
最简单易懂的使用示例请看[libcppjieba]。它是根据[issue25]的建议专门弄的头文件库。
98+
```
99+
make && ./segment.demo
100+
```
101+
102+
see details in `test/segment_demo.cpp`.
100103

101104
### MPSegment's demo
102105

@@ -184,39 +187,49 @@ Query方法先使用Mix方法切词,对于切出来的较长的词再使用Ful
184187

185188
### 自定义用户词典
186189

190+
自定义词典示例请看`test/testdata/userdict.utf8`
191+
192+
载入自定义词典示例请看`test/segment.cpp`
193+
194+
没有使用自定义用户词典时的结果:
195+
187196
```
197+
令狐冲/是/云/计算/行业/的/专家
188198
```
189199

200+
使用自定义用户词典时的结果:
201+
202+
```
203+
令狐冲/是/云计算/行业/的/专家
204+
```
190205

191206
### 关键词抽取
192207

193208
```
194-
make && ./test/keyword.demo
209+
make && ./keyword.demo
195210
```
196211

212+
see details in `test/keyword_demo.cpp`.
213+
197214
you will see:
198215

199216
```
200217
我是拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上CEO,走上人生巅峰。
201218
["CEO:11.7392", "升职:10.8562", "加薪:10.6426", "手扶拖拉机:10.0089", "巅峰:9.49396"]
202219
```
203220

204-
关键词抽取的demo代码请见`test/keyword_demo.cpp`
205-
206221
### 词性标注
207222

208223
```
209-
make && ./test/tagging_demo
224+
make && ./tagging.demo
210225
```
211226

227+
see details in `test/tagging_demo.cpp`.
228+
212229
```
213230
["我:r", "是:v", "蓝翔:x", "技工:n", "拖拉机:n", "学院:n", "手扶拖拉机:n", "专业:n", "的:uj", "。:x", "不用:v", "多久:m", ",:x", "我:r", "就:d", "会:v", "升职:v", "加薪:nr", ",:x", "当:t", "上:f", "总经理:n", ",:x", "出任:v", "CEO:x", ",:x", "迎娶:v", "白富美:x", ",:x", "走上:v", "人生:n", "巅峰:n", "。:x"]
214231
```
215232

216-
__词性标注是一个未完成的部分,现在只是一个简单版本。__
217-
218-
219-
220233
## Application
221234

222235
### 关于CppJieba的跨语言包装使用
@@ -237,6 +250,10 @@ __词性标注是一个未完成的部分,现在只是一个简单版本。__
237250

238251
如果有需要在`erlang`中使用分词的话,不妨试一下[exjieba]
239252

253+
### libcppjieba
254+
255+
[libcppjieba] 是最简单易懂的CppJieba头文件库使用示例。
256+
240257
## Online Demo
241258

242259
http://cppjieba-webdemo.herokuapp.com/

0 commit comments

Comments
 (0)