按标签归档:ir

浅谈中文分词

NLP(Natural language processing)自然语言处理一直 … 继续阅读

, , 38 comments

几种中文分词算法的比较

中文自然语言处理最首要的就是要中文分词了,现在而言效果最好的还是要算crf了,具 … 继续阅读

, , 9 comments

自动摘要算法

当时yahoo以3000万美元的价格收购了summly的消息传出来之后,貌似大家 … 继续阅读

, , 5 comments

谈谈SVD和LSA

首先SVD和LSA是什么呢,SVD全称是singular value decom … 继续阅读

, , , , , 9 comments

基于用户的协同过滤和皮尔逊相关系数

推荐系统的经典算法就是协同过滤了,协同过滤算法有两种,一种是基于物品的,一种是基 … 继续阅读

, , 5 comments

信息熵

熵的概念是由德国物理学家克劳修斯于1865年所提出。熵最初是被用在热力学方面的, … 继续阅读

, , , , 7 comments

python中文分词

相对于英文而言,中文在计算机处理方面有个必须要面对的问题就是中文分词,英文的单词 … 继续阅读

, , , , 31 comments