基于多Agent技术的异质社会网络群组形成方法研究_王万元_第二章基于激励相容机(17).docx
《基于多Agent技术的异质社会网络群组形成方法研究_王万元_第二章基于激励相容机(17).docx》由会员分享,可在线阅读,更多相关《基于多Agent技术的异质社会网络群组形成方法研究_王万元_第二章基于激励相容机(17).docx(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章基于激励相容机制的社会网络群组形成 第二章基于激励相容机制的社会网络群组形成 社会网络环境下群组形成的主要目标是建立专业的,社会关系紧密的并且工作成本个体 群组。然而如果系统仅仅关注这些目标,一些社会个体可能会提供一些虚假的私人信息来恶 意攻击系统,譬如夸大自身的专业技能,社会合作关系以及工作成本,来提高自身报酬。这 种不诚实的行为不仅会增加任务请求者完成任务的预算,而且会减少诚实个体获得任务的机 会,进而可能导致群组形成失败。基于此,本文致力于设计激励相容机制来保证社会个体在 诚实的提供他们私人信息的情况下能够获得最多的报酬。本章节首先从理论上分析了该激励 相容机制的正确性,然后通过实
2、验验证了该机制不仅能够产生可观的社会效益,同时适用于 大规模的群组形成应用。 2.1引言 i 群组形成,不仅能够在完成任务效率方面优于单独个体,甚至能够完成单独个体所不能 完成的任务。例如在最近兴起的众包 ( Crowdsourcing)应用中 106,任务请求者通常希望 招募由若干个工人组成群组(在本文中,术语 “ 个体 ” , “ 工人 ” 以及 “ 用户 ” 意思相同)来 提高任务完成成功率以及质量,包括提高图片标注正 确率 107,语言翻译正确率 149以及 产品评价客观性 150。另外,有些任务本身需要具有多种不同专业技能的工人合作才能完成, 譬如为了满足软件项目开发的多样化技能需求
3、,任务请求者需要招募到一组具有需求分析, 代码实现,调试和数据分析等不同技能的工程师团队 41-42。然而任务能否成坊的完成,不 仅取决于群组成员是否具有相关的专业技能,同时也取决于群组成员能否高效的合作 27。 例如在软件项目开发应用中,执行测试任务的工程师需要和执行程序实现的工程师不断的进行交 流和调试来优化软件。如果由于工作 风格的不同或者地理位置相距较远不方便交流等原因导致他 们不能高效的合作,该团队将很难按时完成软件开发任务。所以,如何建立一组专业的、合作高 效的群组是任务请求者面临的一个非常重要的问题。 随着社交软件的广泛使用,社会网络给专业的、合作高效的群组形成带来了新的机遇。
4、一方面,社交网络平台每时每刻都会有成千上万的活跃用户,这些具有相关专业技能的用户 可以帮助任务请求者随时随地建立专业的群组 108。另一方面,用户之间积极的社交关系可 以代表一种高效合作性指标 16, 27。例如,在开源软件项目开发网站 Github上,互相连接 的用户可能曾经共同合作过开源项目。这种具有项目合作经历的工人可能在共同完成新的任 务时合作更加高效 28。受社会网络的上述两种优势的驱动,我们考虑在社会网络环境下形 成专业并且合作高效群组来完成任务请求者的任务,其中专业性是指群组工人能够满足任务 的所有技能需求,高效合作性是指群组成员紧密连接从而使得他们能够高效的进行合作协调。 社会
5、网络环境下群组形成可以通过一个反拍卖模型实现。在该模型下,任务请求者首先 9 东南大学博士学位论文 通过在线众包平台(譬如 Amazon Mechanical Turk1, Guru2, Upwork3以及 Linkedln)发布任 务所需要的技能。然后工人开始竞标获得完成任务的机会,竞标的内容包括该工人可以提供 的技能服务,工作报酬以及邻居工人(即能够高效合作的同伴)。基于工人的竞标信息,众包 平台为任务请求者建立最经济的(即能够产生最大社会效益的群组),专业的并且合作高效的 工人群组。然而,如果众包平台仅仅考虑到最大化社会效益这一目标,一些工人可能会通过 竞标虚假的信息来提高他们自身的收益
6、,例如,工人可能通 过夸大自身的专业技能,社会合 作关系以及工作成本来提高获得更髙报酬的可能性 87。这种不诚实性行为,一方面可能减 少哪些诚实提供私人信息的工人受聘机会;另一方面,这种提高工作成本的欺骗行为同样会 增加任务请求者完成任务的预算。社会网络环境下的群组众包应用,如果没有足够的工人参 与并且完成任务的成本高,最终会导致群组形成的失败 109。因此,设计激励相容机制来保 证每个工人都诚实的提供他们的私人信息对于社会网络环境下的群组众包应用的健壮发展是 非常有必要的 110。 然而直接运用传统的社会网络群组形成方 法 16, 27, 30, 54-56, 59, 62是不可行的, 因为
7、这些方法不能够保证工人的诚实性。直接运用传统的以建立最优工人群组为前提条件并 且能够保证工人诚实性的 VCG(Victory-Clarke-Groves)机制 111-113也是不可行的,因为形 成专业的、合作高效的群组问题是 NP难问题,建立最优群组需要指数级 O(W)的计算复杂度, 这里代表工人数目,大代表任务所需要的技能数目。基于此,我们提出两种低计算复杂度 激励机制来解决不同规模的社会网络群组形成应用。对于任务规模较小的群组形成应用,本 章提出一种固定参数 ( fixed-parameter)计算复杂度为 0(24fc)的激励机制。该机制首先将社会 网络转换成二叉树网络,然后在该二叉树
8、网络上利用动态规划方法形成最优工人群组。对于 任务规模较大的群组形成应用,本章提出一种基于贪心思想的多项式 0(P)计算复杂度机制。 该机制根据工人的社交结构和技能来建立合适的可行性群组。本章最后利用真实众包网站中 工人和任务数据来验证本章提出的机制性能。实验结果表明了固定参数机制产 生的社会效益 非常接近经典的 VCG机制产生的社会效益,并且贪心机制能够在损失少量社会效益的同时能 够较好的扩展到大规模应用中。 2.2问题描述 任务 d壬务请求者首先发布任务请求 r=, 其中 FT表示如果任务 r能够成功完成, 任 务 请求者将会获得的经济收益;表示任务 r所需要的技能,例如 java编程和
9、数据分析等技能。我们用表示任务的规模,即 所需要的技能数目,这里函数 w表示 集合 X的基数。 社会网络 :我们用 SN=表示社会网络系统,其中 = /, 2,., 表示工人集合,二元 组 e五 表 示 工 人 和 q之间存在高效合作关系。每个工人可以通过三元组 表 1 2 3 10 第二章基于激励相容机制的社会网络群组形成 示,其中兄 .eCV表示工人拥有的技能,换言之,如果技能 尺 .,那么工人能够提供技能 服务印成本变量 C,表示工人 被招募并且提供技能服务的最低薪酬(即工作成本),譬如, 一个工人一旦被雇佣(不管该工人提供哪些技能服务),任务请求者可能需要支付给该工人每 小时 $
10、20薪水; M表示工人 ,.能够高效合作的同伴,换言之,幻。接下来我们 将通过一个反拍卖模型具体描述众包平台如何构建该社会网络系统 SN。 基于反拍卖的社会网络群组形成模型: 该模型可以概括如下:任务请求者首先向所有的 工人发布任务技能需求 Or,然后每个工人提交他们各自的竞标标 5,.= (, c,, M),其中尺 ,说, .,以表示个体 能够提供的技能服务, C,表示提供这些技能服务 &的最低薪酬要求, M表示他的邻居合作伙伴。任务请求者收集到工人提供的竞标信息后,就可以构建整个社会 网络网络系统,包括工人拥有的技能服务,社会合作关系以及薪酬要求。这些信息都是由工 人自身决定的,可能并不一
11、定代表工人真实的私人信息,设计激励相容机制的目标就是使得 每个工人真实的提供他们的私人信息兄,和 M。 我们用从 =(咖表示激励相容机制,其中群组形成函数 1=;2, .表示工人是否被 选为群组成员,其中 x; =l, 表示工人 a,被选中, x/=0表示未被选中。我们用集合 表示被选中的群组工人。为了能够成功的完成任务乃形成的群组 S必须满足下壶两个条件 . 1)专业性 :任务的每个技能需求必须至少能被一个工人满足,换言之,队 30疋; 2)高效合作性: 在群组 0中,每个群组工人必须有至少一个邻居同伴在该群 组中,即由群组工人 2组成的子网络必须是连通的。报酬函数 P,p2, .,外 表示
12、任务完 成后,支付给每个工人的报酬。对于那些被选中的群组工人该工人的净收益的可以表 示为获得的报酬 A和技能服务成本 c,之间的差值,即在工人真实的提供私人信息情 况下的也等于内 -c,。 而对于那些未被选中的工人办他们的净收益斤。当任务成功的完成 并且工人报酬己经支付,那么任务请求者获得的净收益则为任务自身产生的收益 &和完成任 务所要支付给群组工人报酬之间的差值,即 我们进一步定义系统的社会效益 ( Socia丨 Welfare, 5TF)为任务请求者的收益与工人的收 益之 和 等 同 于 任 务 完 成 收 益 6 与 被 选 中 群 组 I人薪酬 i要求的差值, 即 = 6 - 本 文
13、 主 要 考 虑 社 会 效 益 最 大 化 目 标 , 接 下 来我们将形式化社会网络下群组形成问题。 定义 2. 1社会网络群组形成问题 ( Social Team Formation Problem, STFP)。 给定任务 r=,工人竞标信息 S= 尽, 52,. .A和以工人竞标信息建立的社会网络系统 SN=, 社会网络群组形成问题希望建立能够最大化社会效益的、专业的、合作高效的工人群组 2, 形式化表示为 Maximize fVr (21) 受限于 yu = x,ys; e - 1SJ e T (2_2) 11 东南大学博士学位论文 x, +xj-r,wr /=1表示能够提 供,
14、&= 表示不能提供。约束条件 ( 2-3) - (2-5)目标建立连通的工人群组使得他们能够高 效的合作完成群组任务。在约束 ( 2-3)中,表示工人仍和 之间的合作关系 (办巧 )被选 中当且仅当这两个合作伙伴和巧被选为群组成员。在约束 ( 2-4)中, w,表示工人 a,是否 是群组中拥有最小下标的工人, w,=l表示是,叫 =0表示不是。对于拥有最小标号的群组工人 即我们称该工人为根节点工人,如果始终存在一条连接路径顺着从 &可以到达任 意其他被选中的节点卜那么建立的群组是连通的。约束条件 ( 2-5)表示,一个工 人能够被被选中,那么对于任意一个包含根节点工人的集合 *S, 当前仅当该
15、工人满足下面两 个条件之一 ( 1)所有被选中的工人 加尸 1包含在 中(即 /心 4)=丨),要么至少存在一条割边 (aH,av)e%S)在这些被选中的工人节点中。函数 /CS, 為 ) 定 义 如 下 : 如 果 那 么 , 否 则 。 然 后 ,函 数 表 示 被 割 集 ( &4以 ) 断 开 的 边 , 即 ,对于任 意其 他 的 竞 标 信 息 并 且 对 于 任 意 的 其 他 工 人 竞 标 信 息 可 以 得 到 那么该社会网络群组形成机制是激励相谷的。 对于这种单参数的机制设计问题,其中每个工人 , 只有工作成本 c, 私人信息,机制 是激励相容的当前仅当社会群组形成函数
16、X是单调的并且支付函数 P吵是基于阈 值支付的 114。 定义 2.3单调的群组形成函数和阈值支付函数 :群组形成函数义是单调的,当且仅当对 于任意的工人及其工作成本 c , ,,如果 x,(B,, 5-,)=l,那么; e/尽,凡 ,户 1,其中及 夺 =。阈值支付函数则要求支付给工人化的报酬灼是免所能竞标的并且能够被 选中的最高报价,即乃足 ,)=1。 Victory-C丨 arke-Groves (VCG)机制的缺陷 :对于高效的激励相容机制 M=(X, /V),除 了要满足激励相容性,还要满足群组形成函数 X和支付函数都是计算可行的。因此,传 统的 VCG机制 115,以最大化社会效益
17、为前提条件来设计阈值支付函数满足激励相容性, 是计算不可行的因为社会网络群组形成问题 STFP是 NP难的。我们可以将带权的集合覆盖问 题 116规约到简化的社会网络群组形成问题 STFP, 其中社会网络是全连通的。事实上,即 使利用当前最先进的群组形成技术 65,都要花费指数级别 0 /)的时间开销形成最优群组。 该方法在任务规模 5,网络规模 60的问题规模下是计算不可行了。基于此 ,t沐章 2. 3节 和 2. 4节分别提出了两种适用 于一般问题规模和任意问题规模的激励相容机制。 2. 3面向小规模任务的社会网络群组形成机制 面向小规模任务的群组形成机制的主要思想如下:给定社会网络系统
18、SN,我们不直接在 该社会网络 SN中建立最优群组,而是首先将该社会网络转换成二叉树网络,然后在该二叉 树网络中设计出固定参数的群组形成机制。在计算复杂度领域 116,一个依赖于参 数的指数级复杂度算法,如果灸是固定、较小值的数,而且该算法的时间复杂度随着的 变化增长比较小,那么该算法仍然是计算可行的。 2. 3.1树网络结构抽取 给定社会网络系统 SN, 我们目标是从 SN中抽取出一棵树网络 r,并且能够保证该树网 络尽可能的保留原社会网络 SN中的合作关系信息。直观的讲,我们目标是这样的,在原社 会网络 SN中,如果两个工人是紧密相连的,那么在抽取的树网络 r中,这两个工人仍然要 13 东
19、南大学博士学位论文 算法 2.1树网络结构抽取 ( Tree Extraction,/) 输入:社会网络 输出:树网络 r。 a=0, chj max=Q; fordo 3. 计算印的紧密度 d(知 SN户成 ASN); 4. If CLiaSNmaXy then max=CL(ai,SN)f ar-an end for 6 7 8 r=ruar; while A0 do for Va,A: da r,a)=d do A=A-ai), rrUla/, d=dv /*在树 r中,工人 ai的双亲节点是从心到 1 丨最短路径 (.爪 1瓜 上丨的上一个节点 ai-n */ 10. end for
20、11. end while 紧密相连。保留这些合作关系信息使得我们仍然能够在树网络 r中,形成专业的、合作高效 的群组。基于社会网络科学的相关定义 117,我们首先定义网络和工人节点的社会合作紧密 度。 定义 2. 4网络紧密度和工人节点紧密度: 给定社会网络 SN=,我们目标从 SN中抽取树结构 网络 r,使得 r尽可能多的保留原网络 SN中的社会合作关系信息,即最小化 |cx(SN)-cx(r)|。 不难发现,在网络 SN中删除一条合作连接不会增加网络紧密度,那么我们可以得到 CL(SN它 cz(r)。 树结构抽取问题也就等同于从 SN中抽 取出一颗最优树亡使得尸的紧密度最 大,即 rka
21、rgmaXrCZ(r)。 这种树网络紧密度最大化问题是一个经典的 NP难网络设计问题的 变种 115。但是传统的网络设计问题 118与树网络结构抽取的目标不同,所以他们的方法 并不适用。基于此,我们提出了一种多项式时间的近似树结构抽取算法,具体参考算法 2.1. 在算法 2.1,步骤 2-5中,我们目标找到树网络 r的根节点。在步骤 3中,对于每个节点印, 我们首先计算该节点的紧密度 CX(a,, SN)。在步骤 6中,我们选择拥有最大紧密度节点 &为树 r的根节点。然后,在步骤 7-U中,我们采用广度优先搜索策略来建立树 r:首先将与 &社 4如果 4和 是不连通的,那么 J(化外 SN)=
22、0, 1/成叫力 SN)可以赋值为一个较大的实数。 14 第二章基于激励相容机制的社会网络群组形成 图 2.1(a)-(b):将社会网络 ( a)转换成树网络 ( b); (b)-(c):将树网络 ( b)转换成二叉树 ( c) 会合作距离为 1的节点加入到 a; 的第一层孩子节点集合 Ozl中,即 VoieC/jl,成弘 SNM。 然后,将与外社会合作距离为 2的节点加入到 &的第二层孩子节点集合 CA2中。对于第二层 中孩子节点 aieC7i2, 他的双亲节点就是沿着 &到 a;的最短路径上 a,.的钱一个节点,也就是 说,在原网络 51中,如果 &到印 .的最短路径为 办 ,.,取 ;,
23、以,那么印在树中的双亲节点就 是化 /。我们持续利用这种广度优先构造树程序直到所有节点都被加入到树 r中(步骤 7)。 接下来,我们分析一下算法 2.1的近似度。 定理 2.1:用 cz(r) 和 分 别 表 示 由 近 似 算 法 2.1和最优算法得到的树结构网络紧密 度。那么,算法 2.1的近似度 cz(r)/cz(rvai),其中变量 D表 示 原 网 络 的 直 径 , 即 Z max/ a,為 ., SN)。 证明 :用符号 r和 &分别表示算法 2. 1 得 到 的 树 结 构 及 其 根 节 点 。 用 式 和 分别表示节点和 在原网络 SN和树 r中的最短距离。在树 r中,每个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Agent 技术 社会 网络 形成 方法 研究 王万元 第二 激励 相容 17
限制150内