人工智能教学实训
建设方案
北京红亚华宇科技有限公司
二〇二〇年
第一章 发展背景......................................................................................................4
第二章 方案优势......................................................................................................5
2.1. 方案优势......................................................................................................5
1
2.2. 系统优势......................................................................................................5
第三章 教学实训......................................................................................................6
3.1. 学习模式......................................................................................................7
3.1.1..............................................................................................................................实验模式
7
3.2. 练习算法......................................................................................................8
3.2.1...................................................................................................................................算法集
8
3.2.2...................................................................................................................................数据集
8
3.3. 在线考试......................................................................................................9
3.3.1..............................................................................................................................理论考核
9
3.3.2..............................................................................................................................实践测评
9
3.4. 智能教务......................................................................................................9
3.4.1...................................................................................................................教学进度分析
9
3.4.2...................................................................................................................教学计划管理
9
3.4.3...................................................................................................................实验报告管理
10
3.5. 平台管理....................................................................................................10
3.5.1..............................................................................................................................用户管理
10
3.5.2..............................................................................................................................资源管理
10
3.5.3..............................................................................................................................系统管理
10
第四章 红亚教学资源............................................................................................11
4.1. 人工智能基础课程资源............................................................................11
4.1.1.......................................................................................................................... Linux 基础
11
4.1.2..............................................................................................................................编程基础
12
4.1.3..............................................................................................................................数学基础
14
2
4.1.4........................................................................................................................ 数据库基础
15
4.1.5............................................................................................................. Python 数据处理
16
4.2. 人工智能课程资源....................................................................................19
4.2.1..............................................................................................................................机器学习
19
4.2.2..............................................................................................................................数据分析
20
4.2.3..............................................................................................................................数据挖掘
21
4.2.4..............................................................................................................................深度学习
22
4.2.5...................................................................................................................自然语言处理
23
4.2.6........................................................................................................................ 计算机视觉
24
3
第一章 发展背景
当今,世界无时无刻不在发生着变化。对于技术领域而言,普遍存在的一个
巨大变化就是为大数据(Big data)打开了大门。随着国家大数据战略推进实施
以及配套政策的贯彻落实,大数据产业发展环境进一步优化,社会经济各领域对
大数据服务需求进一步增强,大数据的新技术、新业态、新模式不断涌现,产业
规模持续保持高速增长态势。并且,随着高校获准开设“数据科学与大数据技术”
专业,大数据需要的复合型人才将源源不断形成。加之海外和传统行业跨界人才
不断加入大数据行业,大数据产业将迎来创新发展。
大数据时代的来临加快了人工智能应用的发展,随着大数据的应用,以及计
算机算力的大幅提升,深度学习进一步提升和完善的需要得到了满足,数据驱动
的人工智能时代已经到来,人工智能发展进入新阶段。当前,新一代人工智能相
关学科发展、理论建模、技术创新、软硬件升级等整体推进,正在引发链式突破,
推动经济社会各领域从数字化、网络化向智能化加速跃升,数据科学与人工智能
的结合越来越紧密。
大数据及人工智能成为国际竞争的新焦点,是引领未来的战略性技术,世界
主要发达国家把大数据、人工智能的发展作为提升国家竞争力、维护国家安全的
重大战略,加紧出台规划和政策,围绕核心技术、顶尖人才、标准规范等强化部
署,力图在新一轮国际科技竞争中掌握主导权。当前,我国国家安全和国际竞争
形势更加复杂,必须放眼全球,把大数据及人工智能发展放在国家战略层面系统
布局、主动谋划,牢牢把握新阶段大数据及人工智能国际竞争的战略主动,打造
竞争新优势、开拓发展新空间,有效保障国家安全。
4
第二章 方案优势
2.1. 方案优势
基于云模式的智慧教育人工智能教学实训平台的设计全面落实“产、学、用、
监、评”一体化的思想和模式,从教学、实践、使用、监控、评估等多方面注重
专业人才和特色人才的培养。学生可以通过在教学平台的学习熟练掌握人工智能
的基础知识,通过掌握的知识在人工智能课程实验中进行动手实践。
本实训系统平台方案融合操作系统、数据库、编程语言、Python 数据处理、
人工智能等课程,人工智能领域涉及深度学习、机器学习、深度学习、自然语言
处理、计算机视觉等诸多方面,课程类型包括基础实训、关键技术掌握、应用创
新等等各层次实践教学。从面向人工智能行业的需求、促进学生职业发展的角度,
规划建设基于云模式的人工智能教学实训平台,真正在产业、学校及实际项目中
相互配合,发挥优势,形成生产、学习、实践、运用、监控、评估的系统运作模
式,从而建设大数据及人工智能特色专业。
利用虚拟化教学资源,搭建实训实战平台,将理论学习、实践教学和大数据
及人工智能搭建、挖掘、存储、分析实战融为一体,从易到难、循序渐进,逐步
提升学生的学习技能和实践水平,提高“学”的质量和成效。定制专业化技能评
估与教学监控功能,将学生的学习情况、专业喜好、适用岗位形成报告模版。秉
承着“精准、先进、创新”的原则,实时监控学生操作,分析学习情况,评估学
生知识水平,从而减轻学校及教师的压力。
2.2. 系统优势
人工智能教学实训平台基于开源的 Docker 环境,构建硬件虚拟化设备,并
基于同样开源的 Kubernetes 架构,实现 GPU 集群设备的自动管理和调度,以 Yarn
为核心,构建了资源管理系统,实现计算任务的智能调度与冲突协调。一个基础
平台的生命力,有赖于系统的基础支撑能力与对外服务能力。在面向人工智能计
算需求的建设开发上,必须要考虑如何开发组织系统对外服务的能力。而人工智
能研发需求的两个基本要素就是
计算和数据。因此,本系统也着眼于组建
5
基础计算能力和基础数据处理能力。在计算能力建设中,系统将传统人工智能计
算方法与计算模型、当前流行的人工智能计算模型与框架,完美地融入了整个系
统的计算模块中,并且与底层的硬件管理与计算资源的调度,完美地结合在一起。
在数据能力的建设中,系统将自建一套以非结构化数据的标记清洗,结构化数据
的清洗为主要内容的数据处理系统。
在系统底层硬件管理上,支持 CPU、GPU、FPGA、ASIC 等通用或专用计
算硬件,实现对主流计算硬件的即插即用。在计算集群的设置上,往往也是分布
式的,计算集群可以分布在不同机房中,不受空间限制,是人工智能教学实训平
台在底层硬件管理上的特点。
在系统最核心的调度算法上,通过系统自身构建的智能化调度策略,针对不
同的计算框架和机器学习方法,系统自动分配相应的计算资源,包括处理器数量、
内存数量,使计算请求与计算资源的使用达到最优匹配,提高计算资源的利用效
率,降低单位时间的运行成本。同时,当用户发起计算请求时,系统会根据用户
距离计算中心的“距离”,自动将用户的请求适配到距离用户最近的计算集群上,
以便用户可以更快速地获取计算结果,提升用户的计算体验。
在教学管理方面,平台自带人工智能课程推荐功能,可为学生提供个性化课
程推荐及 AI 课程助手,助力学生定向就业。还可以通过大数据分析,自动生成
学业报告,为学生就业提供桥梁,并作为教师教学的得力助手,为高校的学生能
力培养及教师的工作提供强有力的支持。
第三章 教学实训
人工智能教学实训平台的建
设采用 B/S 架构,用户通过浏览器进行访
6
问,且支持内网与外网同时访问。平台的管理功能是针对前端系统设置的对应的
管理功能,便于教学过程中对前端系统的自定义管理。系统课程学习模式包括实
验平台、项目路径和职业路径,满足不同场景的教学需求。在教学管理方面,平
台自带人工智能课程推荐功能,可为学生提供个性化课程推荐及 AI 课程助手,
助力学生定向就业。还可以通过大数据分析,自动生成学业报告,为学生就业提
供桥梁,并作为教师教学的得力助手,为高校的学生能力培养及教师的工作提供
强有力的支持。
实训平台采用私有云模式,所有课程均在云端进行,自主研发设计的教学平
台可将硬件资源进行集中调度分配,可管理大规模 CPU、GPU、FPGA 等高性能
分布式计算集群,利用容器技术对计算资源进行虚拟化,以智能调度的方式对外
提供计算服务,并依托开源分布式计算框架和深度学习框架,支持训练、推理,
支持 CNN、RNN 等各种类型的网络模型,支持 Xgboost 等传统机器学习模型,
适合大数据、人工智能、深度计算;课程内容涵盖操作系统、编程语言、Python
数据处理、机器学习、数据分析、数据挖掘、深度学习、计算机视觉、自然语言
处理等诸多方面,课程类型包括基础实训、关键技术掌握、应用创新等,是一个
综合性的学习研究平台;平台配合专用的资源监控系统、课程监控系统,可实时
的监控整个平台的硬件资源负载以及学生学习的状态,可帮助教师合理的安排课
程及对应资源。
3.1. 学习模式
3.1.1. 实验模式
该模式以知识体系为核心,将人工智能内容按照不同类型的知识模块进行分
类。体系下包含了:操作系统、编程语言、Python 数据处理、机器学习、数据分
析、数据挖掘、深度学习、计算机视觉、自然语言处理等诸多方面,该模式围绕
一个内容展开了多方面知识的学习,与现在教育方式一致,保留了师生们传统的
学习授课方法。不仅如此,为满足学校的已有的课程教学资源,老师可以自定义
实验内容及实验镜像,将文本类、实操类、视频类课程上传到教学平台上满足教
学需求。
7
3.2. 练习算法
3.2.1. 算法集
算法集提供了一个环境,用户可以在里面写代码、运行代码、查看结果,并
在其中可视化数据,并与平台中的数据集功能进行交互式使用,可直接调用平台
当中的数据集用于算法在实际数据中的实践测试。鉴于这些优点,它能帮助他们
便捷地执行各种端到端任务,如数据清洗、统计建模、构建/训练机器学习模型
等。
算法集的一个特色是允许把代码写入独立的 cell 中,然后单独执行。这样做
意味着用户可以在测试项目时单独测试特定代码块,无需从头开始执行代码。虽
然其他的 IDE 环境(如 RStudio)也提供了这种功能,但就个人使用情况来看,
算法集的单元结构是设计的最好的。
算法集的优势还体现在灵活性和交互性上,除了最基础的 Python,它还允许
用户在上面运行 R 语言。由于它比 IDE 平台更具交互性,教师也更乐于在各种
教程中用它来展示代码。
3.2.2. 数据集
数据集功能提供数量众多的数据集,包括互联网、零售、电商、医疗等相关
数据集,数据集中的数据可直接与算法集中的算法进行交互使用,为算法提供所
需数据的调用支撑。
教师可根据数据集的内容、格式、数量等为学生设定开放式课题,使用真实
的数据集进行大数据、人工智能项目案例处理分析,深度理解掌握如何处理这些
数据,例如,教师给定一份数据让学生进行预测实验,学生需设计算法进行清洗
与预测等。
平台提供开放式上传功能,支持用户将自己的数据上传至平台当中,并可设
定是否与他人共用,可帮助用户解决数据存放管理问题,实现用户数据的开放式
共享。
8