科技情报用户画像标签生成与推荐
1 引 言
随着科技的发展和社会需求的推动,科技情报工作经历了由文献资料服务到知识服务再到智能服务的过程[1]。从知识服务向智能服务的转变意味着科技情报工作应当具有预判性和主动性,这就要求提供科技情报服务的单位提前了解服务对象的信息需求,将其信息需求作为服务的依据。在科技情报机构探索科技情报用户的信息需求时,科技情报机构需要面对海量的科技信息,时常会陷入数据迷航的困境中。另外,不同的科技情报用户对同一主题关注点不同,不同部门、不同岗位的用户其关注的侧面也有所不同,如何应对海量信息环境下“千人千面”的用户需求问题,也是决定着科技情报服务水平与效能的一个重要因素。在科技情报领域内,可以应用用户画像方法挖掘科技情报用户的潜在需求,通过准确地把握用户需求,提供更加精准的、动态的、个性化的科技情报服务。
科技情报用户画像是用户画像方法在科技情报领域的具体应用。它采用了用户画像的基本理念,并且增添了新的约束和应用场景。用户画像方法是从海量信息中抽取出用户信息的集合,也是用于描述用户需求、偏好与兴趣的模型[2]。用户画像方法不仅在电子商务和内容推送应用广泛,而且在人才评价[3]、旅游服务[4]、在线评论[5]、社交等领域发挥着重要作用,已经成为精准刻画用户特征、描述用户需求和提供精准服务的重要方法。用户画像方法起源于公安情报,在电子商务领域得到了发展与壮大,电子商务领域建立用户画像的途径是通过网络上获取用户的注册信息、浏览日志、交易记录等网络信息行为数据进行建模分析。科技情报用户画像与电商用户画像不同,它根据科技情报用户发布的内容等公开信息进行关联分析,建立科技情报用户画像。
科技情报用户可以划分为三个层次:高端用户(最高的决策用户)、中端用户(主要指科技管理部门)、科研人员(个人)[6]。由于中端用户发布的数据具有数量多、体量大、公开透明的特点,所以科技服务提供者可以对中端用户——科技管理部门的信息发布数据进行分析,生成具有短文语义性的标签,据此构建科技情报用户画像。然后借此分析情报用户需求,从而实现推荐内容的差异化。值得一提的是,科技情报用户画像方法基于科技管理部门的业务数据,与传统用户画像方法基于用户的行为数据颇有不同。许鹏程等[7]提出了数据驱动下用户画像的“数据化→标签化→关联化→可视化”驱动主路线,为科技情报用户画像的建立提供了参考。
在科技情报用户画像的理论中,生成标签与关联标签是先决条件,用推荐算法为用户推荐合适的标签是探测用户需求可能性的必要方式。采用科技情报用户画像的方法分析科技情报用户信息需求,科技情报机构就可以深入了解用户需求,从而为提供更优质的科技情报服务创造前提。
在已经生成情报用户画像标签的基础上,标签的推荐一般可由推荐组件、计算用户兴趣、结合标签共现、引入受控词表等方法实现。熊回香等[8]提出了从资源-标签-用户三个维度分别建立推荐组件,进而实现个性化推荐的方法。李兴华等[9]提出了基于兴趣-标签的推荐算法ITRA,通过量化用户兴趣得到权重值、用户兴趣相似度、用户候选兴趣集、推荐兴趣-标签集、项目推荐集,将上述集合作为最终的推荐结果。吴小兰等[10]结合用户关系网和标签共现网,对微博用户的标签进行预测,在获得用户候选标签集后,使用基于标签链的方法抽取候选标签推荐给用户,提高了标签预测的准确率。贾君枝等[11]采用受控词表,利用《中国分类主题词表》的层级结构关系和标签的统计学规律,建立标签和主题词之间的映射关系,从而进行推荐。另外,空间向量模型也是构建用户画像和计算标签的重要工具。胡潜等[12]在做社会化标注系统时,采用了空间向量的方法建立了兴趣模型,并以召回率和准确率作为评价指标。本文参考了上述实现方法,提出了适合于科技情报用户画像的推荐方法。
在应用实践方面,用户画像方法还存在一些问题没有很好地解决,在将用户画像方法引入科技情报领域时,也应当考虑这些方面。比如,需要建立反馈机制和维护措施[13];通过搜集标签建立用户画像时,要考虑数据的用途[14];构建用户画像时,宜采用多种方式,以免建立的用户画像不全面[15]。
科技情报机构和科技管理部门分别是用户画像的建立者和服务对象,为了建立科技情报用户画像,需要确定画像的信息来源,可从科技情报机构的服务内容和科技管理部门的数据特征来考虑。有学者总结了科技情报机构的服务内容,主要包括情报研究、科技评估、科技查新、科技统计四个方面[16]。在分析了大量科技管理部门发布的数据后,笔者将其数据划分为以下几类:与具体科技项目相关的内容(包括科技规划、科技服务、科技信息、科技成果与奖励等)、行政政策类(如地方法规、政策文本及解读等)、新闻公告(如活动通知、领导讲话),以及决策与统计内容(含科技统计报告、公开目录等)。由此可见,科技管理部门发布的数据与科技情报机构的分析对象高度相关,前者发布的数据特别是文本数据,可以作为情报用户画像建立的来源。
文章来源:《水产科技情报》 网址: http://www.sckjqbzz.cn/qikandaodu/2021/0208/339.html