中国人民大学信息资源管理学院MlisDA(图书情报硕士,数据管理方向)必修课《行业前沿进展》于2022年秋季学期首次开课,课程负责人为院长刘越男教授,课程设计的十次专题讲座邀请不同行业知名专家主讲数据中台、数智化转型、大数据挖掘、科学数据管理、数字经济、数据要素市场、大数据核心技术、政府数据资源管理、图书馆发展现状与趋势、自动驾驶技术等议题。以下是《行业前沿进展》历次讲座回顾。
讲座1:《面向“双一流”建设的高校学科数据中台建设与应用实践》
9月19日,中国知网产品副总监肖洪先生做了题为《面向“双一流”建设的高校学科数据中台建设与应用实践》的报告。首先,肖老师分析了高校学科数据中台建设的政策背景和实践需求,认为现阶段高校学科点在人才培养、科学研究、学科建设等领域存在情报分析的需求场景。随后对学科建设的相关政策文件进行说明,其中亦明确了情报分析、数据管理的潜在要求。同时,高校学科建设的相关任务中透露出数据分析、信息化建设的必要性。其次,肖老师阐述了学科数据中台框架和服务设计,介绍了平台的整体框架、数据中心、面向学科建设的大数据指标体系、平台的关键技术、学科大数据挖掘分析服务,并通过数据分析案例直观呈现了其基本过程。最后,肖老师讲解了数据中台的商业价值和应用案例,详细说明了平台的核心价值、数据优势、技术优势、团队优势、项目经验、具体的应用、实践案例。
讲座2:《数据、情报与智库》
9月26日,军事科学院国防科技创新研究院栗琳研究员做了题为《数据、情报与智库》的讲座。首先,栗老师阐释了数据、情报与智库的关系。从数据演化历史、相关术语概念等方面分析情报学学科发展的新特点,做出政府对智库的新需求使得数据、情报与智库得到一体化研究的判断,并从不同角度对情报与智库的关系进行解读。其次,栗老师阐述了对数据智能时代情报工作特点和情报机构转型的理解,认为目前的情报工作具有三个特点:开源情报已成为主流、数据处理能力有助于填补情报信息收集与分析间的鸿沟、“敏捷情报”和“智库智囊”成为重点。情报机构开始形成面向安全、面向发展的情报机构转型方向。最后,栗老师审视了数据管理在装备保障中的应用,认为装备数智维修保障是装备保障数智化转型的重要内容,并从数据科学的角度对其组成部分进行了拆解。
讲座3:《数据挖掘在双边交易市场中的实战——点 线 面》
2022年10月10日,腾讯新闻数据部画像挖掘组负责人、算法高级工程师李慧女士做了题为《数据挖掘在双边交易市场中的实战——点 线 面》的行业报告。第一,关于背景,李老师概述了双边交易市场增长的基本逻辑、增长思路,从而形成了以长期DAU增长为目标的实现路径。第二,在互联网生产中的用户画像刻画上,李老师基于案例对“画像”的内涵、用户基础画像的构成、用户画像数据挖掘的核心环节进行了生动且细致的讲解。第三,在数据挖掘的主体间关系和图谱表达上,李老师界定了“关系”,并介绍了内容偏好体系、关系图谱两种关系刻画方式,并阐释基本原理和流程环节。第四,在供需体系下的精细化智能增长上,李老师说明了目前互联网所形成的“成本”效率机制、预算的最优化分配方式。
讲座4:《从评价角度看图情学科数据及研究的相关需求和进展》
10月17日,中国科学技术信息研究所科学计量与评价研究中心主任潘云涛研究员做了题为《从评价角度看图情学科数据及研究的相关需求和进展》的讲座。首先,潘老师从科学范式、科学资源以及科研生态三个角度,对现阶段开放科学对科技创新的风险与挑战进行了论述,并认为数据资源规模及使用将成为大国博弈的重点,新的学术学科体系已基本形成, AI参与知识创造已成热点。其次,潘老师介绍了数据驱动的逻辑,认为AI生成图书所必备的要素包括人工智能技术、计算能力以及数据资源,但在主题选择、内容原创、文本要求以及伦理问题上仍有局限,她判断AI生成图书已成为学术出版新模式,为科研人员提供了获取信息和知识的新方式。再次,潘老师阐释了数据驱动下图情领域的变化和实践,包括阅读方式改变、科研工作流程变化、开放科学下大数据共享平台的建设、期刊计量指标变化等。最后,潘老师从图情学角度提出了现阶段我们所面临的真问题,对同学们思考图书情报领域的问题具有启发意义。
讲座5:《数字经济发展及创新趋势》
10月24日,恒基新业务战略副总裁潘永花女士做了题为《数字经济发展及创新趋势》的讲座。第一,潘老师认为目前我们正在进入一个复杂多变的VUCA(易变、不确定、复杂、模糊)的时代,尤其是数字经济新时代。第二,潘老师讲解了数字经济的概念以及数据集价值化、数字产业化、产业数字化以及数字化治理的“四化框架”,并介绍了我国数字经济发展的基本情况,指出产业数字化已成为我国数字经济发展的主引擎,对重点行业进行说明。第三,潘老师从阿里巴巴案例入手观察我国数字经济发展,提出组织文化是阿里巴巴的发展基石,认为阿里巴巴成为数字经济时代中国式创新的典型案例。第四,潘老师分析了数字化创新趋势,认为我们已经发展到数智化阶段,梳理了企业数字化转型的要点、产业数字化与数字产业化的方向。
讲座6:《关于数据要素市场化配置改革路径的思考——基础制度与市场体系》
10月31日,国家发改委价格监测中心副主任、粤港澳大湾区大数据研究院院长王建冬研究员做了题为《关于数据要素市场化配置改革路径的思考——基础制度与市场体系》的讲座。在背景方面,王老师认为国家高度重视数据要素市场培育和基础制度建设,从中央到地方出台了相应的战略性文件。在市场领域,我国数据分布显示为倒二八特征,数据市场创新创业不断发展,数据流通技术趋于成熟。由此,建立数据要素基础制度成为我国经济发展的战略性举措。在基础制度框架构建上,王老师阐释了目前数据要素化市场改革的瓶颈,并认为制度建设需要依托对传统要素改革的吸收借鉴和再创新,包括产权制度、流通制度、分配制度和治理制度。在培育市场体系上,王老师认为应当以构建全国统一数据大市场为目标导向,并从培育市场交易主体、规范交易场所、明确交易标的、完善交易规则、激发交易活力五大方面入手。王老师认为数据要素市场将带来数据资产评估师、数据产品保荐人等多种新兴职业,为各位同学的职业发展提供了更宽广的视野。
讲座7:《大数据理论基础》
11月7日,美团公司配送实时数据组负责人李金康先生做了题为《大数据理论基础》的讲座。11月7日,美团公司配送实时数据组负责人李金康先生做了题为《大数据理论基础》的讲座。首先,李老师梳理了大数据技术发展历程,以谷歌为例介绍了其面对数据存储、处理方法和数据分析结果呈现的解决方案。其次,李老师基于谷歌给出的解决方案阐述大数据的存储、计算、服务技术,重点讲解分布式存储系统(GFS)、数据计算的MapReduce模型以及数据库BigTable架构的技术原理和特征。最后,李老师阐释了目前大数据主流框架和关键技术,尤其是Lambda架构、Kappa架构两种主流技术框架,详细说明技术框架的特点、关键技术以及基本原理,并比较大数据关键技术Hadoop生态、Flink编程模型。李老师对大数据技术发展历程、基本原理以及主流的技术方案的讲解丰富了同学们对于大数据底层技术的认识。
讲座8:《政府数字化转型与数据资源管理》
11月14日,国务院发展研究中心公共管理与人力资源研究所综合研究室主任赵峥研究员做了题为《政府数字化转型与数据资源管理》的讲座。首先,赵老师阐述了政府数字化转型的顶层设计和微观实践进展,介绍了我国政府数字化转型在战略规划层面的重要地位,明确了我国政府数字化转型的微观切入口和三大重点领域。其次,赵老师梳理了我国政府数据资源管理现状,明确了现阶段需要考虑的问题:一是我们应当如何客观理性地理解“大数据”,通过梳理大数据发展历史,提出数据资源管理的重点在于思想和方法;二是需要思考数据资源管理是否孤立存在,强调需要思考数据资源管理与经济社会发展的关系,以及与政府和社会不同主体之间的关系;三是应当考虑探索如何平衡数据资源管理的绩效与安全,认为需要“智治”与“制治”结合,一方面坚持科技向善,放大数据的正外部性;另一方面发挥制度优势,完善相关法律法规制度。
讲座9:《图书馆的现在与未来》
11月21日,国家图书馆研究院院长申晓娟研究馆员做了题为《图书馆的现在与未来》的讲座,从图书馆建设实践出发,剖析了图书馆建设发展的六大重要进展与未来趋势。一是图书馆的空间再造与职能转变。一方面图书馆服务从以书为主体向以知识为主体展开,强调知识的产生、传播与交流;另一方面图书馆从以阅览为主的空间向交流和开放的空间转变。二是体系化发展,实现图书馆服务的普遍均等。申老师介绍了图书馆体系化进展重点案例,并提出体系化发展的理想模式应为统一管理、统一采编、统一平台、统一服务、统一标准以及通借通还。三是智慧化转向,形成更具智慧的图书馆。申老师阐释了不同图书馆在智慧化转型过程中所采取的措施,并提出了对于智慧图书馆的理解。四是建设立体化资源体系,形成更丰富、更具吸引力的馆藏资源。申老师认为随着信息与知识数据环境的急剧变化,图书馆作为信息与知识的提供者,需要广泛采集、保存和利用与人的智慧活动相关的各类型动态数据。五是开展阅读推广,服务图书馆的核心职能。申老师归纳了阅读推广的多元模式以及不同地区采取的富有特色的阅读推广策略。六是强调社会力量参与,丰富发展路径。申老师梳理了现阶段社会力量参与的途径主要有购买服务、捐赠或志愿服务、提供公共文化服务以及参与管理决策四种方式,并提出对社会力量参与图书馆服务的反思。最后,申老师展望公共图书馆建设的未来发展十大趋势。
讲座10:《量产级自动驾驶技术》
11月28日,Momenta自动驾驶技术高级研发总监范淼先生做了题为《量产级自动驾驶技术》的行业讲座,系统阐述了自动驾驶技术分级、自驾传感器情况、量产自驾技术栈和自驾案例。
首先,范老师指出自动驾驶可以分为驾驶员负责和自动驾驶系统负责两阶段,共L0-L5五级,详细阐述不同级别自动驾驶技术的具体表现、实现标志。其次,范老师讲解了自动驾驶技术的主要硬件条件,即自驾传感器,提出目前无人驾驶感知传感器主要包括摄像头、激光雷达、毫米波雷达和超声波雷达,介绍了不同传感器的类型、作用,以及不同传感器在自动驾驶汽车上的布局。随后,范老师展示了自驾技术栈,以谷歌自动驾驶汽车为例介绍了主要技术模块,包括感知系统、决策系统以及执行系统。针对既定的技术模块,亦形成了从模块解耦到完全整合的不同量产技术栈,范老师讲授了各个技术栈的核心原理。最后,范老师通过自动驾驶汽车的量产案例分析了无人驾驶汽车可能遇到的路况及其因应情况。
2022秋季学期的《行业前沿进展》是中国人民大学信息资源管理学院专门为MlisDA专业硕士打造的数据管理领域行业前沿进展的精品课程,旨在汇聚各行各业数据管理顶级专家智慧,培育未来数据管理行业精英,创建人大信管学院在大数据时代的育人高地,谱写“以数据赋能社会,以历史预见未来”办学使命的新篇章。