深兰科技夺冠信息检索领域顶级会议SIGIR 有效提升电商非相关性搜素匹配率

时间:2019-08-04 来源:www.allweatherny.com

优德w88登录 ? 有效提升电商非相关性搜素匹配率

  10:50

  来源:每日科技播报

SIGIR是该领域信息检索领域的顶级会议,有效提高了电子商务的非相关搜索匹配率

最近,SIGIR,信息检索领域的顶级国际会议,在法国巴黎成功举办,申兰科技再次夺得冠军!在SIGIR2019电子商务研讨会上,DeepBlueAI团队赢得了高精度召回任务挑战赛的第一名。

SIGIR2019电子商务研讨会侧重于信息检索和自然语言处理研究及其在电子商务中的应用,并具体讨论了电子商务领域的产品搜索和推荐方法。此次活动的亮点是eBay组织的“高精度召回任务”数据挑战,吸引了来自世界各地的20多个团队。

数据具有相应图像URL的产品标题,价格,类别目录和URL。参与者应合理使用数据集。确定查询短语和文档是否相关。

通常,用户在电子商务平台上的搜索结果按维度而不是相关性排序,例如流行度,评论得分,价格,距离等,这与传统的面向信息的搜索不同。在这种类型的搜索中,文档以相关的顺序出现,并且许多搜索方法利用了这一点,但对非相关排序顺序的研究较少。这一挑战的重点是找到使用非相关排序时应该召回的内容。这是一个非常棘手的问题,包括典型的搜索挑战,例如模糊性,多个查询意图等。

DeepBlueAI团队承认,每次比赛都是验证神兰科技基本算法和技术实力的机会。该模型还将用于神兰的quiXmart快速智能零售平台,以提高搜索场景的匹配率。神兰科技始终致力于基础研究和应用开发,数据挖掘分析作为技术水平最低的,在后期应用中起着至关重要的作用。通过不断改进和完善,这些技术有望应用于申兰科技的产品和解决方案,更多的是为民生服务。

DeepBlueAI团队基于挑战数据集构建了一些有意义的手工特征,并基于良好实现的文本相似度计算模型ESIM,叠加了阈值机制并设计了生成的Gate-ESIM网络。同时,该团队还根据训练集使用了10%的交叉验证。组合多个子平均值以搜索每个搜索关键字的标签划分阈值。结果证明,该方案大大提高了用户非相关性搜索的匹配指标,并在Ave-F1指标上取得了很好的效果。该解决方案不仅可以应用于电子商务的召回任务,还可以应用于智能客户服务,文章推荐等需要进行文本匹配的场景中。

SIGIR(ACM国际信息检索研究与发展会议)国际计算机学会信息检索大会是一个重要的国际论坛,介绍信息检索领域的新技术和新成果,重点是信息存储,检索和传播的各个方面,包括研究策略,产出计划和系统评估。等待。国际信息检索会议的历史可以追溯到1971年,当时举办了ACMSIGIR的信息存储和检索研讨会。第一次正式的SIGIR会议于1978年在纽约罗切斯特举行,每三年在美国以外举行,2019年在法国巴黎举行。亚马逊,eBay,

仅提供信息存储空间服务。

申兰科技

挑战

匹配率

数据集

罗切斯特

读()

投诉