|
深圳做网站排名关键词怎么分词?中国汉字博大精深,每一个词都有很多的意思,经过不同的组合又会有很多解释,不同的语气也有不同的意思,所以对搜索引擎来说机器语言去识别人类的语言就更难了,这时候我们要选好合适的词能够更好的让搜素引擎理解我们的表达,所以关键词分词就显得格外重要。 分词的概念分词的方式 分词的概念,中文分词指的是把一个比较长的汉语词语切分成一个一个单独的词语,按照一定的规格重新组合成词序的过程,也被称为中文的切词 例如:“北京宠物交易市场”可以分为“北京”“宠物”“交易市场”“北京 宠物 交易市场”而搜索引擎能识别的是“北京宠物”“北京交易市场”“宠物交易市场”“北京”“宠物”“交易市场”“北京宠物交易市场”这7个词,搜索引擎有一个词库会去匹配这一个词,而这7个词就好像是他的词库。 分词的方式 基于字典匹配的分词方法基于统计匹配的分词方法基于理解匹配的分词方法 基于字典匹配是指将目标词或者句与已有的字典中的词条进行匹配处理,扫描之后匹配成句、词、字等形式。按照扫描方向的不同,可以分为“正向匹配”和“逆向匹配”;按照扫描方向和长度优先混合匹配,可分为正向最大匹配、和逆向最大匹配等;还有一个混合匹配。 举例说明:我们和服务员工作在一起 正相匹配:我们,和服,务,员工,作,在一起 逆向匹配:我们,和,服务员,工作,在,一起 举例说明:一寸光阴一寸金 正向最大匹配:一寸光阴一寸金 逆向最大匹配:一寸光阴一寸金 混合匹配是指基于统计分析大量的数据,扫描计算出字或词或句,几个相邻的字出现的越多就会形成一个词,同样的形式可以成句。 由于汉语的博大精深,目前的搜索应请还是很难做到基于理解的分词技术,不过随着以后技术的发展人工智能也是越来越先进,估计在不久的将来人类想什么搜索引擎能退回到当时人的心情! |