本科科研项目与数模大赛总结

本科科研项目题为web2.0社区服务的注册与分发。web2.0社区即形如豆瓣社区模式的社区,其与普通社区论坛不同之处在于加强了社交性与个人相关功能,如博客,状态等。而所有这些社区提供的功能我们都可以认为是一种社区系统提供的服务。项目正是基于这样一种社区系统,同时这个社区系统有其独有的衍化功能,即社区可以分割,组合以及继承产生子社区。我们的项目主要研究第三方服务如何在社区中集成并以友好的方式展现以供用户使用以及如何向用户推荐最符合用户兴趣需要的服务。

首先的任务就是探索服务如何在社区中展现,而在解决这个问题前首先就必须定义社区服务。已经提到的概念是所有社区提供的功能都是社区服务,但是社区本身提供的功能有限,这时需要第三方服务商提供他们的服务集成到社区中以供用户使用,所以问题关键是第三方服务商到底能够提供哪些类型的服务。这里的类型指的是服务的实现方式,我们的考虑是可以支持多种实现方式的服务,目前主要考虑web application和web service后者包括两种模式,一种基于soap,一种基于restful。我们需要提供一种通用接口,包括服务商注册服务的接口以及用户使用的接口,重点在于用户使用的接口,用户不应该也不需要察觉自己在使用一个web应用还是被封装了的web服务。通过解析web服务的wsdl获得操作及所需参数,系统调用相应服务将信息以友好的方式返回给用户。这一阶段我们主要工作在于完成了服务商注册时参数与社区信息的对接以及反馈信息的形式,即一个较通用的web服务的应用生成器。

其次任务就是探索服务如何分发到正确的用户。我们可以认为加入某个类型社区的用户拥有与社区关键字相同的兴趣。因此问题的关键在于将服务在正确的社区中推荐给用户。服务商可以指定社区注册服务也可以只注册到社区系统。针对前者,需要考虑社区中注册的服务如何分发到正确的子社区;而后者则需要选择正确的社区展示这些服务。同时我们需要考虑可能服务商将服务错误的归类,以及如何界定一个服务是适合这个社区用户的,这就是一个推荐引擎的设计问题。我们首先的考虑是基于内容的推荐,即使用关键字匹配,即用服务描述信息的关键字匹配社区的关键字,实现采用wordnet过滤出服务描述中的名词再采用km算法匹配社区关键字。这样基本可以保证服务的正确归类,但正确度以及符合度仍然是个问题。于是我们又引入了服务Qos测算以及用户反馈的基于协同过滤的推荐机制。Qos由于时间关系先主要集中在服务连接的时间和吞吐量上面,根据tmin/tb+n/nmax(1-b)来计算这个值。同时需要考虑即便一个服务质量再好,如果与社区主题不符也不能算优质服务,于是结合Qos的值与关键字匹配相似度一起算最后的结果即sp+(1-p)v,这里面的p不能简单的设定,因为你不知道用户是更关注准确性还是服务质量,因此必须提供一个用户反馈的渠道并让系统做出相应调整,这里p正是与这个反馈结果挂钩。用户反馈用打分系统实现,打分结果经过统计反映到p中。

数模大赛题目是找出论坛中的言论领袖,话题用户以及活跃用户,采用2/8原则与贝叶斯判定。用户在某一论坛的精华帖与置顶帖数目来判断言论影响力,用户在某一话题的发帖数与跟帖数来确定话题感兴趣程度,用户在论坛中的发帖与跟帖总数衡量用户活跃度。根据2/8原则(用户是言论领袖)即先验概率可定为20%,不产生为80%;言论模型:影响力即函数总和。函数等于帖子楼高除以最高楼高,置顶时间除以最长时间,精华帖比例的和除以到目前为止的时间,用这个函数值除以最大函数值即(言论领袖产生这些行为概率?似乎有问题)之后采用贝叶斯公式得出产生这些行为的用户是言论领袖的概率。其他类似。。。

本站总访问量