SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 1691|回复: 1
打印 上一主题 下一主题

【求助】中文名称的match问题

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2013-7-8 15:38:17 | 只看该作者

【求助】中文名称的match问题

求指教:

我有两个dataset,一个里面企业名称用的全称,另一个里面用的是简称,大概有几万条数据,如果编程能简单的将两个dataset合并?

如:
dataset1:
firm
长春百益制药有限责任公司
江苏中晟半导体设备有限公司
上海奥狮网络科技有限公司
山东实杰生物药业有限公司

dataset2:
firm
百益制药
中晟半导体
奥狮传媒
山东实杰

如果能大概其的把两个dataset连接在一起?名字中还有英文的,我记得英文里有一个compare两个单词的match程度的变量,不知道中文怎么做?

谢谢!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2013-7-9 22:07:13 | 只看该作者

Re: 【求助】中文名称的match问题

没人有想法么?英文好像有个fuzzy match的可以得出score的,中文貌似不行。

有没有办法说如果dataset2的简称里每个字在dataset1的全称里都找到,那么就match在一起?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-5-2 18:59 , Processed in 0.069375 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表