1、智慧图书馆的大数据伦理失范问题及伦理规范的发展战略王维秋?刘春丽?刘丽萍?马凤毛摘 要 智慧图书馆的大数据应用中存在个人隐私泄露、信息安全威胁、信息公平失范的伦理问题。本文从主体自身道德底线的缺失、大数据技术不完善、信息不完全和信息不对称的角度分析伦理失范问题的成因,并提出伦理规范的发展战略:从国家、公民和图书馆三个层面加快法律建设;提升大数据应用主体的伦理规范意识;重视智慧图书馆大数据监管;接受来自读者、同行及新闻、网络媒体的监督评价。关键词 智慧图书馆 大数据 伦理失范 伦理规范分类号 G252DOI 10.16810/ki.1672-514X.2020.03.003Abstract Th
2、ere are ethical anomie problems in the application of bigdata in smart library,such as personal privacy disclosure,information security threats,information fairness anomie.Thispaper analyzes the causes of ethical anomie from the perspectives ofthe absence of the subjects own moral bottom line,the im
3、perfectionof big data technology,incomplete information and informationasymmetry.In addition,it puts forward the development strategy ofethical norms,including enhancing the ethical standard awareness ofbig data application subjects,attaching importance to big datasupervision of smart library,and ac
4、cepting supervision andevaluation from readers,peers,news and network media.KeywordsSmart library.Big data.Ethic anomie.Ethics norm.智慧图书馆是通过物联网实现智慧化的服务和管理,依托数字化、网络化和智能化的信息技术手段,具有更加高效和便利特点的现代图书馆运行模式。“大数据”一词是英国数据科学家维克托.迈尔-舍恩伯格和肯尼斯库克耶于 2008年提出,它改变了人们的思维方式与行为1,十余年间,在智慧地球、智慧城市、智慧校园、智慧图书馆等各领域得到广泛应用与研究。随着国
5、家政策的支持及物联网等新兴技术的快速发展,大数据的采集与分析变得方便、快捷,它的应用技术正在改变人们的生活,帮助人们实现对美好生活的向往。同时,大数据的采集分析技术也带来了负面效应,如个人身份信息、个人行为信息以及个人偏好信息的泄露问题不容忽视。近年来,从伦理学角度研究大数据应用的伦理失范问题正在成为图情业界关注的前沿。1 智慧图书馆的大数据伦理规范研究现状通过梳理现有相关的中外文文献发现,大数据伦理问题在生物学及卫生健康领域已进行了较多的研究2,但图书馆领域,特别是有关智慧图书馆的大数据伦理问题却鲜有报道。相关研究主要集中在以下三个方面:一是从技术伦理视角思考图书馆大数据服务中的伦理问题;二
6、是从隐私保护视角研究图书馆认证与访问管理的隐私和伦理问题;三是从信息伦理的视角研究智能时代和大数据时代背景下信息伦理规范和科学数据共享伦理问题。1.1 技术伦理视角下的图书馆大数据服务伦理问题1985 年 Jim Moor 在什么是计算机伦理?一文中指出计算机技术改变了“我们的许多人类活动和社会机构”,并将“给我们留下如何使用计算机技术的政策和概念真空”“通常情况下,要么不存在针对这些情况的行为的政策,要么现有政策似乎不足够”3。2016 年,Michael Zimmer 博士在“图书馆研究数据服务中的伦理问题”报告中,再次提出大数据研究中存在“概念鸿沟”和“政策真空”,新技术和技术环境的出现
7、常常导致我们在如何看待道德问题上存在概念上的鸿沟,以及我们如何解决这些问题的政策上处于真空状态4。Michael Zimmer 分析指出,作为伦理学家,在思考研究伦理的一些最基本原则时,比如隐私(privacy)、同意(consent)和危害(harm)时仍面临着新的概念鸿沟;而作为实践者,我们在决定如何帮助研究人员获取、存储和共享数据集时也同样面临政策真空的新问题。近年来,“随着大数据、开放数据的出现,特别是许多图书馆对雷达屏幕上研究数据的整理,数据服务已成为高校图书馆一个至关重要的课题。”5 Michael Zimmer 进一步分析了图书馆的数据馆员在协助研究者获取、存储和分享用于大数据研
8、究的数据集中遇到的新挑战。1.2 隐私保护视角下的图书馆认证与访问管理问题2008 年,Pam Dixon 指出数字身份验证和访问管理引起了对隐私、可识别性和将读者相关数据公开的关注,进而研究了图书馆身份认证和访问管理所带来的隐私和伦理问题。在美国许多州,图书馆读者信息的私密性受到法律的保护,但在数据访问技术和身份验证的相关讨论中还尚未被足够重视,随后,PamDixon 研究了用于图书馆认证和访问管理系统的伦理分析的核心原则公平信息规范标准及其在图书馆的政策应用中的适用性,并讨論了图书馆的最佳实践6。此外,美国图书馆协会(ALA)关于图书馆记录保密性的政策中就敦促图书馆“正式采取一项政策,明确
9、承认其流通记录和其他包含图书馆用户姓名的记录为机密”。2018 年,法国 Joachim Sch?pfel 在智慧城市背景下提出智慧图书馆的新概念,指出智慧图书馆中的“智慧”不能解决所有图书馆问题7,有一个基本问题需要特别注意:即智能技术的目标和使用与图书馆相关的传统价值观之间存在潜在冲突。智慧图书馆处于大规模的监控中,存在侵犯隐私,削弱“智慧图书馆中的人”的自由的问题。这并不符合国际图联(IFLA)的道德守则中所述的尊重个人隐私、保护个人数据及图书馆流通记录的机密性。1.3 大数据时代信息伦理规范和科学数据共享伦理问题2012 年,东南大学的梁修德指出伦理失范的主要原因是信息活动主题的道德缺
10、乏自律,在网络的虚拟、匿名和隐蔽环境中,信息伦理的规范还需要社会舆论、信息伦理机构和赏罚与监督8。2014 年,广西大学图书馆陆伟华阐明了对大数据时代信息伦理问题研究的必要性,分析大数据时代所面临的信息伦理困境并提出如何走出困境的对策思考9。2018 年,长春理工大学李娟等人研究了智能时代的信息伦理问题,从社会制度根源、技术根源和主体根源三个方面分析了信息伦理问题的成因,并初步构建智能时代的信息伦理体系10。2018 年,合肥工业大学的董军等人从大数据时代数字身份的视角讨论了被盗用、易追溯和身份认同等伦理问题,并提出克服和控制的策略11。2019 年,中国科学院计算机网络信息中心的温亮明等人探
11、讨了大数据时代科学数据共享伦理问题,总结分析了科学数据共享中,伦理理论、困境、问题成因及问题治理是研究热点,提出了大数据时代的一些新伦理问题及未来研究方向12。综上所述,国内的研究是广义上对大数据时代信息伦理问题的讨论及提出控制策略,但尚未研究图书馆环境下的大数据服务涉及的伦理问题。而国外研究也仅是提出图书馆大数据服务中在理论和实践层面上缺乏伦理政策与规范,特别是智慧图书馆大数据监控中可能存在侵犯个人隐私问题。到目前为止,尚未发现关于智慧图书馆理论与实践与大数据伦理问题相契合的研究,但大数据伦理问题只有结合具体的应用背景和环境才可能真正发现伦理规范存在的问题并探讨问题成因,寻找到未来伦理规范的
12、发展战略。因此,在归纳和整理现有相关研究现状基础上,本文将智慧图书馆理论与伦理规范理论相契合,即分析基于不同伦理规范理论下的智慧图书馆的大数据伦理失范问题,从整体上探讨伦理失范问题的可能成因,并对智慧图书馆的伦理规范提出未来的发展战略。2 智慧图书馆大数据应用过程中的伦理失范问题伦理是调整人的行为符合社会道德规范的准则,从理论上讲,伦理规范是指对行为规范与道德的遵守。本文中涉及的伦理问题界定为大数据技术的伦理问题,伦理规范主要关于大数据技术相关的隐私、安全性、数字鸿沟、公平性、可及性、数字身份方面的规范与标准。那么,伦理失范问题就是对这些规范与标准的违反和背离。具体来讲,在大数据应用过程中,侵
13、犯个人隐私、威胁数据安全、造成信息鸿沟、有碍信息公平等行为均属于大数据伦理失范问题。2.1 个人隐私泄露问题个人隐私保护是重要的信息伦理问题。个人信息包含隐私和私密性信息,个人信息的不当使用就是常见的伦理失范行为。个人所产生的数据包括主动产生的数据和被动留下的数据,其删除权、存储权、使用权、知情权等本属于个人可以自主的权利,但在很多情况下难以保障安全。在个人信息保护规范中明确要求泄露私密信息就是侵权,要防止个人信息的泄露,保护个人隐私。在智慧图书馆服务与管理过程中,个人信息和数据采集过程中对读者的个人身份信息、读者的行为轨迹和读者的阅读偏好信息的搜集。那么,可能存在的伦理失范问题主要有:其一,
14、读者个人身份信息方面,数据的所有权不明晰。由于缺乏法律和伦理规范,大数据通过网络可以任意传播,无视被采集者的个人身份和隐私泄露危险。如:大学图书馆的读者信息大部分是从人事处或学生处直接获取人脸图像信息进行人脸识别13,未考虑读者的知情权问题;其二,读者行为轨迹方面存在数据失真问题14,多数情况是读者不愿意泄露隐私,而故意造成“非真实数据”的产生。如个别读者在监控器下的自我故意遮挡行为、有意在图书馆某些区域停留行为等;其三,读者阅读和行为偏好方面的数据被不当利用也是侵犯读者隐私的行为。2.2 信息安全威胁问题信息安全伦理属于典型的科技伦理问题。科学技术在人类发展中具有重要的地位,科学技术伦理不仅
15、仅是个人层面的道德行为的价值观念问题,而且事关社会责任问题。我们必须要正确利用科技成果为社会造福,避免由于不当使用科技成果给社会带来负面影响。信息安全威胁有两大类型:一是来自外部入侵和攻击产生的信息安全威胁;另一个是内部违规非法操作行为带来的信息安全威胁。一些信息技术本身就存在安全漏洞,可能导致数据泄露、伪造、失真等问题,影响信息安全。此外,大数据使用的失范与误导,如大数据使用的权责问题、相关信息产品的社会责任问题以及高科技犯罪活动等,也是信息安全问题衍生的伦理问题。智慧图书馆在大数据存储过程中可能存在的信息安全威胁问题包括:其一,存储方的主观故意行为。这方面原因主要是信息存储人员管理不善所造
16、成。如信息存储人员以营利为目的贩卖用户信息数据而造成的数据泄露;其二,黑客攻击或者盗取造成的数据泄露或数据丢失。由于网络技术漏洞及网络的便捷性、大数据商业价值及相互关联性,使得黑客攻击或盗取数据在当代变得更为便捷与频繁15-16,黑客通过电脑漏洞直接在后台盗取数据的案例屡见不鲜;其三,病毒入侵所造成的数据泄露或丢失问题,如“AV 终结者”等病毒,能以反击杀毒软件、破坏系统安全模式、植入木马下载器等方式盗取数据或使计算机瘫痪造成数据丢失。2.3 信息公平失范问题信息公平失范是数字鸿沟理论的直接现实表现。信息技术带来社会生产和生活便利的同时,也会造成信息不对称、不透明及数字鸿沟问题。缩小数字鸿沟,
17、增进人类福祉、保障社会公平是具有全球价值的伦理问题。从宏观上来讲,数字鸿沟主要是指由于信息和通信技术的发展与应用,造成国家间及国家内部群体之间的信息不对称现象。那么,本文中主要是指数字鸿沟理论在智慧图书馆服务中应用的微观层面的内涵,我们称之为信息公平失范问题。智慧图书馆服务与管理中的信息公平失范主要是指图书馆中不同身份、不同类型、不同级别群体间的数字鸿沟或信息不对称问题,也包含具有较高身份级别的群体的信息垄断现象。在大数据分析结果利用过程中的信息公平失范行为主要表现在两点:其一,数据独裁问题。在大数据时代,数据量的爆炸式增长使得依赖传统的工作模式无法做出准确的判断。如必须依靠大数据分析结果才能
18、更科學和准确为图书馆资源建设与读者服务的改进与完善提供数据支持。但是,仅靠采集的数据分析结果还远远不够精准,工作人员的参与仍然重要。因此,唯数据论必然导致数据独裁,造成最终的工作结果与初衷相差甚远17。其二,数字鸿沟问题。数字鸿沟,又被称为“信息鸿沟”,是指在大数据时代,不同群体之间对资源占有、使用机会及收益分配存在较大差异,存在马太效应18。表现在图书馆方面,如高校图书馆仅凭图书馆集成管理系统中的读者借阅数据或学校各院系读者在图书馆的行为轨迹来给出图书馆资源建设与读者服务方面的分配有失公平。由于学校的院系规模不一,学科的特点和需求不同,且处于动态变化中,应全面、个性化和动态地深入研究,从而制
19、定资源与服务的分配原则。3 智慧图书馆的大数据伦理失范的成因大数据伦理失范问题从根本上是由于社会科技发展中政策、规范、技术的发展速度不匹配导致的,具体来讲也与图书馆的类型、社会环境、技术条件和公民的道德素质与水平密切相关。笔者从整体上进行智慧图书馆的大数据伦理失范成因分析,大致分为三个层面:主体自身道德底线的缺失、大数据技术不完善、信息不完全和信息不对称。第一,大数据应用主体的道德底线的缺失造成无意或有意泄露读者个人隐私。目前,大数据技术在人们的日常生活中得到普遍应用,给人们的工作与生活带来了巨大改变,每个人都受益其中。同时,它相应的商业价值也迅速提升。利益的诱惑使大数据拥有者容易降低道德标准
20、,产生伦理失范。例如,对读者的特征数据如年龄、照片、院系及读者的行为数据如借阅历史、空间预约、数据库使用等,属于读者个人隐私。大数据应用主体如数据馆员及相关部门要遵守隐私保护规范。切不可因为网络的隐蔽性、经济利益的驱使、自控能力差、行为习惯等原因通过任何方式泄露读者隐私,如泄露读者借阅偏好、读者数字资源使用频率、空间预约地点和用途等。第二,大数据技术的不完善与不成熟造成数据安全威胁问题。其一,大数据本身不具有甄别信息的功能,无法进行信息自动管理,无法保证信息源的可靠性与规范性19。同时,大数据技术通过网络作为主要载体,具有虚拟性,缺乏伦理管束和法律约束。其二,大数据技术在给读者利用图书馆设施和
21、资源带来各种方便的同时,也为不法之人提供了数据获取、传播利用的渠道和工具20。其三,大数据技术的加密和代码的伦理约束不成熟,为不法分子提供了隐藏便利,给大数据的采集分析带来了新的伦理学挑战。那么,智慧图书馆管理者和数据馆员要加快提升数据监管水平,采用加密技术等手段,防范恶意攻击者或黑客对读者特征及行为数据库的入侵、攻击或篡改。第三,信息不完全和信息不对称等原因导致信息鸿沟或信息公平失范问题。智慧图书馆中读者的特征和行为数据并不是万能的。一方面,这些数据不能代表读者的全部阅读和利用行为,也不能精确的反映读者的全部阅读和利用需求;另一方面,智慧图书馆读者大数据中所反映的借阅历史及空间、电子资源利用
22、历史也不一定是最真实的客观现实。例如,读者可以因为某些原因,让其他读者代替借阅某些图书,或者为外单位无借阅权限的读者借阅图书;电子资源的利用也可能存在账号外借情况或者读者以经济交换为目的进行电子资源的恶意大量下载;空间利用过程中,读者为了规避政治审查与监管,可能提供虚假的空间利用申请,从事非法或不符合相关规定的活动或聚会。4 智慧图书馆大数据应用伦理规范的发展战略人类今天所面临的和技术不得不应对的最大问题是那些技术发展本身所导致的问题21。大数据采集分析技术所导致的伦理问题已经被公认为社会问题,它既危害到个人的信息安全,也不利于新技术发展所带来的成果共识,造成现代技术与伦理失范的对立,亟待解决
23、。笔者认为,智慧图书馆在应用过程中,建立大数据伦理规范十分关键,制定发展战略势在必行。笔者将从五个方面对智慧图书馆的大数据应用伦理规范的发展战略予以阐述。4.1 从国家、公民和图书馆三个层面加快法律建设法律是维护社会安定有序发展的制度规范,通过制定和完善大数据相关法律可以对大数据行为主体起到规范、约束和引导主体行为作用,使其对大数据行为主体的约束更加牢固。国家层面,完善大数据立法,出台相应的数据采集、存储、分析的“实施细则”势在必行;公民层面,可通过民法总则提高公民对个人数据信息的知情同意权利;图书馆层面,完善图书馆大数据采集分析利用的伦理道德标准,尽快出台细则,规范数据采集、分析、利用权利的
24、使用级别及防失范措施、规范图书馆数据采集存储设备标准等等,使图书馆、馆员、读者都有一个明确的可以维护自身权益的标准与方法,根据本馆的实际情况再进一步规定各级别权限,设定读者隐私数据开放级别等。4.2 提升大数据应用主体的伦理规范意识目前,大数据技术中有关对大数据采集分析隐私的道德修养方面的研究还比较少,因此十分有必要通过大数据伦理规范教育,提升应用主体的大数据伦理规范意识。首先,智慧图书馆的读者特征和行为数据采集与分析馆员要经过相关伦理规范学习与培训才可以上岗。有必要对其进行思想道德教育,使其掌握和遵守道德标准和伦理底线,组织他们学习有关国家数据管理政策、法规、数据伦理等知识,通过学习,让其在
25、思想意识上、實践行为上把伦理规范内化于心,外化于行,具备较强的自我约束能力。其次,智慧图书馆的相关领导可以组织人力、物力和财力,开发大数据伦理规范的宣传片进行正面宣传或搜集伦理失范的反面案例进行警醒教育。4.3 重视智慧图书馆大数据监管数据监管是智慧图书馆有效、安全运作的必要手段,其核心就是建设大数据监管平台,综合运用电子预警、统计分析和数据挖掘等先进技术,围绕智慧图书馆涉及的主要读者和数据馆员行为活动,进行全方位监控和历史数据分析,辅助监管领导及时发现相关人员涉嫌违法违规行为,为智慧图书馆的发展保驾护航。具体可包括读者信息泄露违规分析、电子资源恶意下载可疑人员分析、读者空间利用时间和频率可疑
26、人员分析、恶意攻击软件分析等,以防范在智慧图书馆运作过程中面临的潜在伦理风险和挑战。制定大数据监管规章制度,规范数据采集和应用的程序与规范,对于不按程序和规范办事、存在伦理失范的数据采集、存储、分析使用者进行必要的惩罚,将违法者送交相关机构处理。4.4 接受来自读者、同行及新闻、网络媒体的监督评价培养大数据使用者的道德自觉主要来自于对伦理失范的评价监督,从而让大数据使用者重视大数据伦理规范的重要性。首先,开通多种读者反馈和建议渠道,定期向读者发布图书馆大数据分析报告的同时,采用问卷调查、焦点组访谈、座谈会、开放式访谈等方法搜集读者提出的大数据采集分析存在的伦理问题,允许读者提出质疑,由图书馆领
27、导、馆员、读者、技术人员共同讨论,在公平、公正、合理的前提下满足读者的需求,听取读者的建议,接受读者的评价和监督,为读者提供满意的服务。其次,倡导行业自律,在鼓励进行智慧图书馆行业中评比最佳伦理规范实践案例,建立行业制度和规范,进行大力宣传。最后,充分发挥新闻媒体与网络媒体的评价作用,对与大数据采集分析有关伦理失范案例进行解析与评论,鼓励广大观众与网友的参与,以此引导规范的大数据采集分析行为。5 结语大数据技术的广泛应用及引发的伦理学问题逐渐获得较高的关注,现阶段主要表现在国家相关法律及主体的行为道德标准层面,而对大数据技术相关伦理学问题研究不多,处于起步阶段。针对智慧图书馆大数据应用所涉及到
28、的伦理实证研究就更是少之甚少。笔者认为,未来的研究方向应着重从这几个方面展开。一方面是数据异化既数据依赖问题。不能完全以各种统计数据制定资源采购与读者服务工作政策,必须还要兼顾图书馆的资源采购方针和政策,结合本馆客观实际情况做出合理安排等,如何解决“唯数据论”,让数据作为重要的参考决策依据有待研究。另一方面是人工智能伦理问题。近几年来,机器人馆员在智慧图书馆也逐渐应用起来。那么,如何对待机器人馆员和普通馆员之间的关系?2019 年,李彦宏特别提出要“加快推动人工智能伦理研究”,只有建立完善的人工智能伦理规范,处理好机器与人的新关系,我们才能更多地获得人工智能红利,让技术造福人类22。第三方面是
29、伦理问题的问题域及研究人员问题。2019 年,谷歌新成立了人工智能伦理委员会,目的是指导公司“负责任的人工智能发展计划”,以讨论对谷歌人工智能项目的各种担忧问题。但在几名委员会成员的争议中出现了瓦解的迹象。可见,智能环境下,伦理问题的研究必是一个受争论的社会问题,需要结合政治学、社会学的交叉学科人才共同解决,绝不仅仅是技术专家解决驾驭的问题23。因此,智慧图书馆大数据应用的伦理问题研究还任重而道远。参考文献:维克托迈克-舍恩伯格.大数据时代M.杭州:浙江人民出版社,2013.MARCELLO L,AGATA F,et al.Considerations for ethics review of
30、 bigdata health research:a scoping reviewJ.PloS One,2018(13):1-15.MOOR J H.What is computer ethics?J.Metaphilosophy,1985,16(4):266-275.ZIMMER M.Addressing conceptual gaps in big data research ethics:an application of contextual integrityJ.Social Media Society,2018,4(2).ZIMMER M,BLACKS K.Assessing th
31、e treatment of patron privacy inlibrary 2.0 literatureC/Proceedings of the 2012 iConference.ACM,2012:501-503.DIXON P.Ethical issues implicit in library authentication and accessmanagement:Risks and best practicesJ.Journal of library Administration,2008,47(3/4):141-162.SCH?PFEL J.Smart librariesJ.Inf
32、rastructures,2018,3(4):43.梁修德.信息倫理规范实现的社会监督机制J.图书馆,2012(4):27-31.陆伟华.大数据时代的信息伦理研究J.现代情报,2014(10):66-69.李娟,迟舒文.智能时代的信息伦理研究J.情报科学,2018(11):61-65.董军,程昊.大数据时代个人的数字身份及其伦理问题J.自然辩证法研究2018(12):76-81.温亮明,张丽丽,黎建辉.大数据时代科学数据共享伦理问题研究J.情报资料工作,2019(2):38-44.王维秋,刘春丽.基于人脸识别技术的我国图书馆智慧服务功能设计与模式构建J.图书馆学研究,2018(18):44-5
33、0.田维林.大数据伦理失范问题的成因与防范研究J.思想教育研究,2018(8):107-111.邱仁宗,黄雯,翟晓梅.大数据技术的伦理问题J.科学与社会,2014(1):36-48.董军,程昊.大数据技术的伦理风险及其控制:基于国内大数据伦理问题研究的分析J.自然辩证法研究,2017,33(11):80-85.宋振超,黄洁.大数据背景下网络信息的伦理失范、原因及对策J.理论与改革,2015(2):172-175.宋吉鑫.大数据技术的伦理问题及治理研究J.沈阳工程学院学报(社会科学版),2018,14(4):452-455.李娟,迟舒文.智能时代的信息伦理研究J.情报科学,2018(11):61-65.齐格蒙特鲍曼.后现代伦理学M.张成岗,译.南京:江苏人民出版社,2003:2-4.俞吾金.如何理解康德关于“人是目的”的观念J.哲学动态,2011(5):25-28.李彦宏.加快推动人工智能伦理研究EB/OL.2019-03-10.http:/ 中国医科大学图书馆副研究馆员、资源建设部主任。辽宁沈阳,110122。刘春丽 中国医科大学图书馆副研究馆员、硕士生导师。辽宁沈阳,110122。刘丽萍 中国医科大学图书馆馆员。辽宁沈阳,110122。马凤毛 中国医科大学图书馆副馆长,医学信息学院副院长、副研究员。辽宁沈阳,110122。(收稿日期:2019-07-20 编校:谢艳秋,左静远)