SAS中文论坛

标题: 【求助】中文名称的match问题 [打印本页]

作者: shiyiming    时间: 2013-7-8 15:38
标题: 【求助】中文名称的match问题
求指教:

我有两个dataset,一个里面企业名称用的全称,另一个里面用的是简称,大概有几万条数据,如果编程能简单的将两个dataset合并?

如:
dataset1:
firm
长春百益制药有限责任公司
江苏中晟半导体设备有限公司
上海奥狮网络科技有限公司
山东实杰生物药业有限公司

dataset2:
firm
百益制药
中晟半导体
奥狮传媒
山东实杰

如果能大概其的把两个dataset连接在一起?名字中还有英文的,我记得英文里有一个compare两个单词的match程度的变量,不知道中文怎么做?

谢谢!
作者: shiyiming    时间: 2013-7-9 22:07
标题: Re: 【求助】中文名称的match问题
没人有想法么?英文好像有个fuzzy match的可以得出score的,中文貌似不行。

有没有办法说如果dataset2的简称里每个字在dataset1的全称里都找到,那么就match在一起?




欢迎光临 SAS中文论坛 (http://www.mysas.net/forum/) Powered by Discuz! X3.2