将逗号分隔的类别 ID 减少到顶级 ID 的正则表达式
Regex to reduce comma separated category ids to top level id
对正则表达式很陌生,所以第一个问题是这可能吗?
我的产品可以属于多个类别/子类别,但为了报告,我只想为每个顶级类别归因一次。
原始数据:
1010,1012,1012610,1014243,10147048956,2010,201150205,2011506,2015470
期望的结果:
1010,1012,1014,2010,2011,2015
详情
1010不变
1012,1012610 减少到 1012
的 1 个实例
1014243,10147048956 减少到 1014 的 1 个实例
2010 不变
201150205,2011506减少到2011年的1个实例
2015470 减为 2015
我当前的模式 (?|(10..)|(20..)) 运行良好,但以下粗体部分除外:
1010,1012,1012610,1014243,10147048956,2010,201150205,2011506,2015470
关于减少,我不知从何下手
提前感谢您的任何帮助或指导。
\b(\w{4})
1010,1012,1012610,1014243,10147048956,2010,201150205,2011506,2015470
应用正则表达式“\b(\w{4})”后,您能否在 Set 中收集值,这将使这些元素独一无二。
对正则表达式很陌生,所以第一个问题是这可能吗?
我的产品可以属于多个类别/子类别,但为了报告,我只想为每个顶级类别归因一次。
原始数据: 1010,1012,1012610,1014243,10147048956,2010,201150205,2011506,2015470
期望的结果: 1010,1012,1014,2010,2011,2015
详情
1010不变
1012,1012610 减少到 1012
的 1 个实例
1014243,10147048956 减少到 1014 的 1 个实例
2010 不变
201150205,2011506减少到2011年的1个实例
2015470 减为 2015
我当前的模式 (?|(10..)|(20..)) 运行良好,但以下粗体部分除外:
1010,1012,1012610,1014243,10147048956,2010,201150205,2011506,2015470
关于减少,我不知从何下手
提前感谢您的任何帮助或指导。
\b(\w{4}) 1010,1012,1012610,1014243,10147048956,2010,201150205,2011506,2015470
应用正则表达式“\b(\w{4})”后,您能否在 Set 中收集值,这将使这些元素独一无二。