世界今日报丨有哪些指标可以评估搜索引擎的质量?搜索引擎质量评测
搜索引擎,在做好query理解、索引召回以及排序模型之后,就能直接推上线了吗?答案是否定的,还需对其性能和质量进行评测。性能无非是对时间和空间的运行效率作评测,不细讲,今天讲讲搜索引擎的质量评测。通过质量评测,可根据评测结果不断的进行改进和研究,也可以验证搜索引擎在真实环境中运行时的实际效果。因此,搜索引擎的质量评测对于整个系统的研制和发展是至关重要的。
那么有哪些指标可以评估搜索引擎的结果质量呢?最广为人知的指标就是准确率和召回率。
(资料图片)
准确率、召回率
准确率和召回率广泛用于信息检索和统计学分类领域的两个度量值,用于评价结果的质量。其中准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。
公式如下:
因为搜索引擎处理海量数据,如果召回率达到很高,对于后续的排序以及引擎整体性能都有副作用,并且用户只会看一小部分,所以召回率太高对于满足用户需求来讲意义不大。但过高的追求准确率,可能会导致召回不全,或许某些搜索引擎的垂搜场景需要更多的长尾词带流量,但由于准确率要求极高,很多词会存在出不来对应结果的情况。因此在不同的场合中需要自己判断希望Precision比较高或是Recall比较高。也可以绘制Precision-Recall曲线来帮助分析。也可以使用F值来调和准确率和召回率的互斥关系。
P@10指标
此指标更关注搜索结果排名最靠前结果的质量,用于评估最终排序top10个文档中有多大比例是相关的。公式如下:
P@10 = 相关文档个数 / 10 * 100 %
这种方法比较暴力,并且只追求top10的结果不够全面,对于电商搜索来讲,此种方法基本无效。
MAP指标
MAP指标(Mean Average Precision)是针对多次查询的平均准确率衡量标准,是评价检索系统质量的常用指标,如果有阅读过信息检索相关paper或者参加过排序类的竞赛,会经常遇到这个评价指标。
所谓MAP就是对AP取平均值,AP是衡量单个查询的检索质量的。AP值其实是对P@n的一个扩展。上述的P@10,n固定为10,而AP的计算是平均P@1,P@2…P@n所有的值。
如下图:
对所有的AP值求平均值,就得到了MAP指标。
NDCG指标
NDCG(normalized discounted cumulative gain,归一化折损累计增益)是一种近年来逐渐被采用的指标,尤其是在基于机器学习的排序方法中。NDCG是针对连续值的指标,它基于前k个检索结果进行计。公式如下:
DCG(Discounted Cumulative Gain): Cumulative为将所有的结果累加起来, Discounted指给排在后面的结果加一个折扣系数, 排序位置越靠后, 折扣系数越小.
DCG@N的计算方式如下
IDCG为理想情况下最大的DCG值。
自动化评估方法
以上指标都是基于有监督的情况进行指标测算的,也就是需要利用手工标注答案的方式进行评价,人力成本和时间成本都非常高。虽然在学术界用的比较广泛,但在工业界其实用的比较少。工业界更关注收益,比如ctr(点击率,点击的人数/看到的人数)和cvr(转化率,下单购买的人数/点击或浏览的人数),那有没有一种方法可以快速的并且自动化的评测方法来提高评估效率呢?答案就是A/B testing。
A/B testing系统在用户搜索时,由系统来自动决定用户的分组号(Bucket id),通过用户的分组号自动将流量导入不同分支,使得相应分组的用户看到的是不同搜索引擎或者不同算法提供的结果。此时需要将用户行为进行埋点,用户在不同版本产品下的行为将被记录下来,这些行为数据通过数据分析形成一系列指标,而通过这些指标的比较,最后就形成了各版本之间孰优孰劣的结论。
为保证其公平性一般有几点要求:
本文为大家总结了常用的评价指标和评价自动化流程。对搜索结果的质量评测,目的是准确的找出现有搜索系统的不足,进而对算法优化、对系统改进,提高投入产比。 最后欢迎关注微信公众号:药老算法(yaolaosuanfa),带你领略搜索、推荐等数据挖掘算法魅力。
标签:
相关推荐:
精彩放送:
- []每日热点:iphone数据线连接电脑没反应怎么办?解决方法如下
- []天天简讯:lol点亮图标在哪?英雄联盟图标在哪里?
- []全球即时:冬季最耐寒好养的花有哪些?十大最耐寒的花卉
- []每日快讯!海利得:二级市场股价走势受多重因素共同影响,具有一定的不确定性
- []全球速读:赵本山的徒弟有哪些?最出名的十大徒弟是谁?
- []天天观点:一瞬间的近义词是什么?一瞬间的近义词有哪些?
- []环球精选!万达地产等新增被执行人信息,执行标的超10.8亿元
- []当前短讯!遗怎么组词?遗字读音及解释
- []黄金市场分析:需突破2030美元的阻力位,才能测试三角旗形的目标位2043美元
- []天天热点!ThreadX操作系统是什么?ThreadX操作系统介绍
- []如何读懂路由表本机地址?routeprint命令可以查看路由表
- []即时焦点:五大利好支撑!美国银行看涨金价至2100美元!
- []世界视点!为什么你的抖音视频没点赞和播放量?抖音视频没点赞和播放量的原因
- []天天快消息!第六套人民币什么时候发行?发行时间是多少?
- []全球快讯:洛阳:支持国晟集团收购5000套存量房用于租赁住房
- []当前观点:帕瓦股份:公司与关联方蓝天园林之间关于“园林建设、工程设计“的关联交易,尚未确定,存在不确定性
- []天天实时:suggest是什么意思?suggest的用法有哪些?
- []【世界新视野】制造浪漫的方法有哪些?营造浪漫求婚氛围的常见方法
- []天天观热点:4月6日汇市观潮:欧元、英镑和日元技术分析
- []乐不思蜀的历史人物是谁?乐不思蜀典故介绍
- []全球热消息:网传链家在北、上之外城市转为加盟模式,贝壳:消息不实
- []世界消息!忘记建行个人网银登录密码怎么办?个人建设银行网上登录怎么查余额?
- []天天视点!安卓手机下载不了软件是怎么回事?怎么解决?
- []如何做好职工福利费的会计分录?关于职工福利费的会计分录
- []世界速讯:中信建投期货4月6日贵金属早报:经济前景疲软 贵金属后市偏向强势
- []全球热消息:餐厅吊灯高度怎么调?餐厅吊灯的正确安装高度
- []今热点:1加6t是什么牌子的手机?一加手机品牌介绍
- []【世界热闻】科语智能扫地机器人好用吗?科宇C500评测详情
- []世界新动态:三星tabs怎么样?三星GALAXYTabT805C(4G版)平板电脑评测
- []波导手机的价格多少?国产老牌子波导手机怎么样?
- []如何自制花肥方法?4种自制花肥制作方法
- []世界观速讯丨昆船智能:公司当前不涉及上海洋山港agv引导车的相关业务
- []焦点讯息:oppo手机上面HD如何取消?oppo手机上面HD取消方法
- []焦点简讯:蔚为壮观的意思是什么?蔚为壮观怎么造句?
- []电视遥控如何和机顶盒遥控对接?对接教程
- []当前关注:鞋带蝴蝶结怎么系?鞋带蝴蝶结的系法步骤图解
- []头皮屑多怎么办?头皮屑多有可能传染吗?
- []消息!WIFI和WLAN有什么区别?WIFI和WLAN区别介绍
- []全球速读:进销存软件哪家强?上百种进销存软件大比拼
- []世界新动态:跨境电商营销推广的方法有哪些?跨境电商8大推广引流方式
- []即时:个人用户如何在知网系统提交知网查重?具体操作步骤
- []excel如何制作简版出库表?excel制作简版出库表
- []当前讯息:美国三大股指什么意思
- []基金托管费是什么
- []环球热议:python程序接收命令行参数的方式及步骤
- []当前头条:笔记本电脑当无线路由器怎么设置?设置流程
- []pp助手安装失败怎么办?PP助手修复方法
- []【环球报资讯】VEX为什么要用到中间表达式?为什么要用到VEX?
- []即时:联想平板电脑价格多少钱?联想平板电脑价格及型号
- []全球要闻:C语言基础知识入门 C语言的具体结构
- []【焦点热闻】怎么将电脑的进程隐藏起来?隐藏进程怎么设置?
- []天天热点评!QQ怎样绑定密保手机?QQ绑定密保手机的方法
- []如何查询电脑上的IP地址?我的ip地址查询方法
- []在哪里看股指期货的行情?股指期货行情信息
- []播报:歪歪如何申请短位ID?歪歪语音使用文字聊天的方法
- []环球微头条丨卫生间排气扇价格是多少?卫生间排气扇价格及安装
- []环球热议:角位移传感器怎么安装?角位移传感器安装方法详解
- []每日热讯!太阳能热水器如何除垢?太阳能热水器除垢方法有哪些?
- []苹果8怎么查看手机常去位置?详细操作步骤
- []当前动态:基金定投可以随时取出来吗
- []Java进阶1-JVM虚拟机 JVM在字节码上的使用方法
- []5.0以下的主流图片加载框架有哪些?安卓加载图片四大框架
- []全球观天下!如何用PS制作属于自己的个性签名档?用PS制作属于自己的个性签名档教程
- []QLV格式如何转换成MP4?QLV格式转换成MP4的方法
- []环球微头条丨如何使用视频剪辑软件将qsv格式视频转换为MP4格式?方法步骤
- []世界要闻:索尼a330评测详解 新款套机镜头详解
- []环球热推荐:如何实现双显示器拼接?实现双显示器拼接方法
- []环球今日报丨中国“北斗”卫星导航系统——定位模块需求介绍
- []如何利用大数据实现精准营销?会员管理中用户数据的流转及应用逻辑
- []世界快看:操作系统中死锁的算法——银行家算法
- []当前资讯!DirectSound能帮我们做什么?DirectSound开发指南
- []当前视讯!实例分享:python使用多线程不断刷新网页方法
- []“流氓”刘邦战胜英雄项羽的因素有哪些?详情介绍
- []当前热门:【干货】Python与STAT时间日期转换问题
- []全球热议:广西提高服务贸易水平 推动优质桂品“出海”
- []天天精选!iOS13越狱教程:如何安装AppSync和afc2补丁?
- []全球观速讯丨st股票什么股
- []股票开户需要多少钱
- []海昌海洋公园2022年营收同比下降近七成,将持续发展顶流IP
- []链家将27座城市转为加盟模式?贝壳:消息不实,仅为小范围合伙人模式
- []当前速讯:美达股份:公司生产的部分产品可在军民融合领域进行应用,具体请以公司公告和定期报告为准
- []每日看点!国睿科技:中国的城市轨道交通全自动运行(无人驾驶)信号系统处于国际先进水平
- []【全球报资讯】悦榕集团2022财年总计63家酒店收官 计划2025年扩张至113家
- []全球看热讯:我爱我家副总裁何洋辞任
- []我爱我家:五八有限公司拟减持不超过2.74%股份 持股比例将低于5%
- []中国恒大披露重组进展
- []电科院:公司具体经营情况详见以往定期报告
- []焦点讯息:航班老是临时取消?民航局要出手了
- []环球新资讯:国泰君安医药一季报业绩前瞻:业绩复苏环比趋势明确
- []【速看料】中信建投:TOPCon电池、组件超额利润有望扩大
- []眼看AI主题基金起高楼 “消费选手”仍在默默坚守
- []天天亮点!AI+元宇宙!Meta离梦想更进一步?
- []苏州常熟2宗宅地将于5月5日出让 起价合计5.4亿元
- []昭衍新药:公司会紧跟行业技术的发展变化,学习和借鉴相关技术在安评业务中的运用
- []环球百事通!中南建设前3月合同销售额120.4亿元 同比减少26.2%
- []消息!南昌中溢置业将转让杭州通原地产40%股权 底价8031.3万元
- []亚通精工:公司未有应披露而未披露事项,股价涨跌受多种因素影响,股价波动是正常的市场交易行为
- []西安国际港务区挂牌2宗宅地面积共117亩 起始总价为7.894亿元
- []财面儿丨越秀地产1-3月累计合同销售额约人民币438.33亿元 同比上升约217.3%
- []当前视点!海容冷链:公司产品不应用于殡葬行业,公司产品应用于快速消费品行业的渠道建设
- 为什么JDK要自带JRE?JRE和JDK的区别是什么?
- 世界今日报丨有哪些指标可以评估搜索引擎的质量?搜索引擎质量评测
- 【时快讯】网上订票抢票攻略 360极速抢票浏览器使用教程
- 每日看点!Chrome 缓存文件路径在哪?Chrome浏览器缓存文件路径查看方法
- mysql怎么批量添加卡号?mysql句柄SQL(超级列表框)验证成功
- 全球热消息:万达地产集团新增两则被执行人信息 合计执行标的10.86亿元
- 【天天速看料】越秀地产:前3月合同销售额约为438.33亿元
- 四川宜宾:住房公积金最高贷款额可达90万元 放宽提取时间
- 【东海期货4月6日产业链日报】能化篇:库存下降未平息需求担忧,油价涨势停止
- 全球聚焦:如何看K线图?史上最全K线经典组合形态解析
- 每日时讯!将优化调整高校两成左右学科专业布点
- 【全球报资讯】合肥放开部分区域限购! 多孩家庭可买第3套住房
- 世界今日讯!链家欲在北京、上海以外城市转为加盟模式?贝壳回应:无此计划
- 每经热评|当前并非出台房产税政策的好时机
- 天天讯息:一个月的宝宝很容易被惊吓怎么办_一个月的宝宝发育指标
- 【热闻】怎样取公积金
- 今日热门!怎么取公积金
- 天天快看:交强险怎么用
- 贝壳:链家将27座城市转为加盟模式消息不实 仅为小范围合伙人模式
- 当前消息!滕哈赫:现在才是赛季真正的开始,输给纽卡后我们要有积极回应
- 道达尔能源与伊拉克政府就100亿美元天然气开发项目达成一致
- 世界快资讯丨林斌辞任奥园美谷财务总监职务?江永标继任
- 中南建设:中南城投减持212.03万股 占所持股比例0.11%
- 天天百事通!中南建设前三月累计合同销售金额120.4亿元 同比降26.2%
- 胡泊、李强分别辞任南国置业联席总经理、副总经理
- 万达投资新增质押1930万股万达电影 累计质押6665万股
- 环球今头条!刘鑫获任荣盛发展副总裁
- 全球热文:厦门象屿与河南能源集团签订战略合作协议
- 环球最新:4月05日20时青海海东今天新增确诊名单 4月05日20时青海海东疫情防控政策最新通知
- 当前视点!一半乡土质朴,一半文艺先锋,沙漠河流共生的小城,最美季节到了
- 全球热门:户用储能系统有什么用,有哪些特点和应用?
- 全球看热讯:长久物流设立储能全资子公司!
- 天天亮点!不低于1GW!泰达股份联手千泉实业投建光伏项目
- 30万吨光伏玻璃硅砂提纯项目环评
- 天天视点!超10GW!TCL中环单月出货新突破
- 一彬科技:公司生产经营一切正常。公司对未来汽车产业的发展充满信心
- 国际油价小跌,受制于美国制造业降温,本周重头戏待上演
- 焦点要闻:深圳到九江火车时刻表查询_南昌到九江火车时刻表
- 医道彤行,厚积薄发|2021道彤投资年度合伙人大会特写
- 海淘的childlife大瓶钙含防腐剂?专家建议婴幼儿产品选购要谨慎
- 好好香锅公司怎么样
- 观察:鸿路钢构:钢结构是绿色节能产品,是国家提倡并大力推广的装配式建筑的重要组成部分
- 基金经理猛追AI 但斌却突然唱空:一旦被套 不知猴年马月解套
- 关注:难道是真的?青海发现形状怪异的遗骸,揭开大禹治水背后的真相!
- 世界微头条丨维宏股份:整个Phoenix平台包含了软件和硬件两个部分
- 简讯:拜登:人工智能是否危险还有待观察 但科技公司需为安全负责
- 世界聚焦:2023年Q1季度精选文章合集 | 商旅会奖赛道
- 观速讯丨申请破产!暴跌90%
- 【全球新要闻】2023年Q1季度精选文章合集 | 在线旅游/分销赛道
- 每日关注!四川宜宾:住房公积金最高贷款额度可达90万元
- 全球快讯:伊戈尔:公司会根据客户需求和业务开拓的情况提前布局或者调整相应的产能
- 越秀地产:一季度累计销售约438亿元
- 环球今日讯!合肥调整购房政策:部分区域放开限购
- 全球微资讯!全国春风地图出炉 看看你那儿的四月天
- 环球关注:黄金大涨近2% 逼近历史最高纪录!金价为何持续大涨?专家解读
- 当前快报:是否想念篮球?维金斯:我非常想念队友们 期待与他们并肩作战
- 外汇交易提醒:降息预期升温,美元跌创近两个月新低,新西兰联储决议来袭,纽元续涨有望
- 周鸿祎突然离婚,要AI不要爱?董秘回应来了
- accountnumber怎么读_Accountnumber
- 4月5日财经早餐:美数据疲软强化美联储放缓加息押注,金价站上2000美元/盎司大关创三十二个月新高
- 【世界聚看点】高达65%成本节约 施耐德电气适配改造服务助企业把握“循环”机遇
- 银行信贷投放不足原因_银行信贷的作用
- 恒达集团控股2022年收入增加约3.4% 纯利减74.3%至7780万
- 环球速读:车险佣金
- 看热讯:三大保险
- 热讯:寿险功用
- 当前资讯!聚焦中概 | 小鹏汽车跌幅扩大至7% 造车新势力普跌
- 双十原则
- 当前快看:乌龟冬眠是为了放水还是放沙?
- 天天快消息!周鸿祎与胡欢离婚 后者分得三六零4.46亿股、对应市值近90亿元
- 环球观热点:周度经济观察:斜率放缓的经济复苏
- 世界观焦点:申通快递:公司与阿里云合作,通过引入云原生技术实现了技术全面升级
- 全球短讯!深交所、沪交所4月8日全面实行注册制交易业务通关测试
- 亚太药业向下修正可转债价格 律师:索赔宜趁早
- 假期安全注意事项内容图片_假期安全注意事项内容
- 香山股份:目前尚无详细的市场份额数据,更多详情敬请留意公司官网及相关公告和定期报告
- 全球快看:秦安股份:4月3日公司高管刘宏庆减持公司股份合计1.16万股
- 保利发展:房地产持续向好的基本面没有变
- 世界快资讯:越秀地产前三月销售438亿?同比上升217%
- 当前聚焦:格力地产:珠海国资委同意公司收购免税集团 并募资不超70亿元
- 天天观点:保利发展:公司负债率连续三年下降 继续保持稳健财务政策
- 保利发展:灵活安排推货节奏?把握市场修复窗口
- 今日要闻!国家加强铁矿石价格形势分析研判和期现货市场监管
- 世界热资讯!宝馨科技:目前公司怀远一期2GW异质结电池及组件项目正在加速推进中,预计年内投产
- 天天观点:中交城投郑州古荥城更项目获得首笔融资
- 岭南股份:公有云是云计算的主要形态。公司已与腾讯建立云计算、数字虚拟人、大数据等方面的战略合作
- 世界短讯!西安土拍市场“活”了?
- 世界快报:湖北襄阳高新区2.08亿售出65亩宅地 竞得者为本地房企
- 今日热讯:协创数据:公司存储设备主要与联想集团合作
- 【全球播资讯】三代人七十余载接力守护156座抗美援朝烈士墓
- 全球观天下!每日互动:AIGC和ChatGPT都是融合多种AI技术的成果
- 天天滚动:神州高铁:截至2023年3月31日,公司股东人数为91207
- 【天天新要闻】昭衍新药:股价走势受多方面因素的影响,还请谨慎投资
- 世界滚动:财面儿丨建发国际:前3月权益销售额353.4亿元,同比增长63.5%
- 全球实时:土地注册处:香港3月楼宇买卖合约8599份 按年升124.6%
- 【天天新要闻】昆明公租房开发公司最终发行6亿 品种一利率6.5%、品种二未发行
- 全球观点:拼多多升级组织架构 联合创始人赵佳臻出任联席CEO搭档陈磊
- 上海3月新建商品住宅成交面积环比增长94% 均价下跌2.8%
- 天天最资讯丨迪马股份为江苏2家子公司提供融资担保 涉资8.04亿元
- 滚动:狂飙910%!德国大储市场崛起,户储地位岌岌可危?
- 新消息丨最新进展!中科云网5GW TOPCON电池项目一期签署建设施工合同
- 焦点信息:煤矸石综合利用与矿山生态修复的战略思考
- 环球观热点:年产500万吨!全球规模最大光伏砂项目成功签约
- 最大涉水750mm 北京越野BJ60新增车型上市售24.58万-27.68万元
- 【天天播资讯】晶硅组件有什么作用和特点,有哪些种类?
- 环球旅讯+WiT新加坡主题沙龙开场演讲:你好,中国!
- 天天报道:新地University Hill料最快4月底开售
- 环球速递!万通发展:万通控股解质押270万股股份 现持公司股份3.34亿股
- 全球微动态丨建发房地产:10亿元公司债券票面利率为4.25%
- 世界头条:中核钛白:公司第三期员工持股计划并未在2023年3月14日进行大宗交易