如何为用户提供的国家名称预测正确的国家名称?
How to predict correct country name for user provided country name?
我打算对我的数据进行一些数据调整。
情况-我有一个数据,其中有一个字段country
。它包含用户输入的国家/地区名称(它可能包含拼写错误或同一国家/地区的不同国家/地区名称,例如美国的 US/U.S.A/United 州)。我有一个正确的国家/地区名称列表。
我想要的- 预测它指的是哪个最近的国家。例如-如果给出 U.S.
那么它将更改为 USA
(我们列表中的正确国家/地区名称)。
有什么方法可以使用 Java 或 opennlp 或任何其他方法吗?
您可以尝试 Google 的自动完成位置 api 到您的文本框或 select。
如果您将使用此 api,那么您将在键入时获得 google 之类的自动完成智能。
visit link
如果您拥有经过清理的城市或州信息,那么您可以查看国家/地区。
您还可以在国家/地区名称列表中定义别名,并将别名指向首选表示法。例如US、United States、USA都是U.S.A的别名。您可以使程序附加到别名数据库,以便它在使用时得到改进。您可能对数据进行了多次传递,并且还涉及一定数量的手动工作。
您可以使用 Getty API。它会给你国家名称的缩写。就玩这个 API.
或
您也可以使用 Levenshtein Distance 来获取最接近的国家/地区名称。
试试这个。会帮你的。
我打算对我的数据进行一些数据调整。
情况-我有一个数据,其中有一个字段country
。它包含用户输入的国家/地区名称(它可能包含拼写错误或同一国家/地区的不同国家/地区名称,例如美国的 US/U.S.A/United 州)。我有一个正确的国家/地区名称列表。
我想要的- 预测它指的是哪个最近的国家。例如-如果给出 U.S.
那么它将更改为 USA
(我们列表中的正确国家/地区名称)。
有什么方法可以使用 Java 或 opennlp 或任何其他方法吗?
您可以尝试 Google 的自动完成位置 api 到您的文本框或 select。 如果您将使用此 api,那么您将在键入时获得 google 之类的自动完成智能。 visit link
如果您拥有经过清理的城市或州信息,那么您可以查看国家/地区。
您还可以在国家/地区名称列表中定义别名,并将别名指向首选表示法。例如US、United States、USA都是U.S.A的别名。您可以使程序附加到别名数据库,以便它在使用时得到改进。您可能对数据进行了多次传递,并且还涉及一定数量的手动工作。
您可以使用 Getty API。它会给你国家名称的缩写。就玩这个 API.
或
您也可以使用 Levenshtein Distance 来获取最接近的国家/地区名称。
试试这个。会帮你的。