日志分析概况
【种类】:
1.搜索日志:记录用户的查询(关键词)、点击、搜索的结果。
2.浏览日志:客户端浏览器、集成服务提供商等收集;存放用户的查询、点击和网址
3.网站服务器日志
4.用户本地日志,由浏览器收集
#搜索日志:
包含四类主要信息:用户信息(ID、IP)、查询信息(关键词、时间戳、位置、设备)、点击(URL、时间)、查询结果(算法结果、广告、查询建议)
#浏览日志:
用户信息,查询信息,点击信息,浏览信息(URL,时间)
【日志挖掘的目的】:
提高搜索时间*
提高搜索准确性**
【应用】:
1.查询理解:查询扩展、查询建议、查询替换、查询分类、关键词生成等
2.文档理解:文档标注、文档分类、文档摘要、结果聚类
3.用户理解:用户分群、个性化搜索、用户行为建模
4.查询文档匹配:广告点击率预测、网站推荐、广告排名
【数据结构】:
1.查询直方图(查询次数):查询的自动完成、查询建议
2.点击二分图:含有两种不同的对象,左边为对象,后边为返回的url。可应用于文档排名,查询结果聚类、网页总结
随机游走
3.点击模式
4.绘画模式
1.搜索日志:记录用户的查询(关键词)、点击、搜索的结果。
2.浏览日志:客户端浏览器、集成服务提供商等收集;存放用户的查询、点击和网址
3.网站服务器日志
4.用户本地日志,由浏览器收集
#搜索日志:
包含四类主要信息:用户信息(ID、IP)、查询信息(关键词、时间戳、位置、设备)、点击(URL、时间)、查询结果(算法结果、广告、查询建议)
#浏览日志:
用户信息,查询信息,点击信息,浏览信息(URL,时间)
【日志挖掘的目的】:
提高搜索时间*
提高搜索准确性**
【应用】:
1.查询理解:查询扩展、查询建议、查询替换、查询分类、关键词生成等
2.文档理解:文档标注、文档分类、文档摘要、结果聚类
3.用户理解:用户分群、个性化搜索、用户行为建模
4.查询文档匹配:广告点击率预测、网站推荐、广告排名
【数据结构】:
1.查询直方图(查询次数):查询的自动完成、查询建议
2.点击二分图:含有两种不同的对象,左边为对象,后边为返回的url。可应用于文档排名,查询结果聚类、网页总结
随机游走
3.点击模式
4.绘画模式
还没人转发这篇日记