TechYoung 人工智能专修压博网页企划

[TOC]

1 项目概述

1.1 项目简介

在21世纪迎来了爆发性增长的人工智能是毋庸置疑的科技新风口,而机器学习(Machine Learning, ML)则是人工智能最重要分支之一。机器学习交叉应用数学和计算机的多种理论,旨在通过算法提高计算机理解数据和预测数据的能力,是使计算机具有智能的基本途径,其应用遍布人工智能的各个领域。

TechYoung 人工智能专修压博网页背靠中国科学院的一流实验室和阿里云大学的高性能计算平台,面向热点问题和发展潮流,结合机器学习理论和软硬件开发的具体案例精心设计,由中科院计算技术研究所的精英导师亲自授课,为有志于从事人工智能的高中生和本科生提供学术前沿的科研实践。

1.2 项目特色

顶尖科研机构的前沿学术体验

压博网页导师均来自中国科学院,是行业专家,也是热心科技教育的改革者,在青少年科技教育领域已有数年基础,既能为学生带来学术前沿的新鲜知识,也有手把手引领学生开启科研实践的热情。压博网页基于顶尖科研机构的丰富资源,还与业界一流的阿里云高性能计算平台亲密合作,结合学术热点问题和发展潮流倾心打造,充分利用一线实验室多样化的软硬件设备,致力于带给学生最具收获的就学体验。压博网页结束后,根据表现,学员有机会获得中科院推荐信及实习机会

因材施教的个性化教学

TechYoung 的压博网页知识体系由具有殷实学术背景和充分青少年科技教育经验的导师精心设计,面向未来而落于实地,矢志求新而通俗平易,针对高中和本科的科技新鲜人制定最优学习曲线。压博网页鼓励所有对科技怀有热情的学生进行申请,在学生录取上坚持多元化的原则,不对学生的学术背景设置硬性限制,为所有有心学习的青少年敞开科研之门。TechYoung 只期待学生能够认真和真诚地填写项目申请表,用自己对科技的思考和热情打动导师们。一经录取,TechYoung 将基于学生的申请信息,根据学生的背景和兴趣量身定制学习计划,在交互式教学中实时跟进学习进度,并设置导师对话时间(Office Hour)提供一对一自由交流的机会,确保每个学生都能尽其潜能学有所成,真正实现因材施教。

真实创客项目开发经历

TechYoung 系列压博网页引入美国大学研究实践项目(Capstone Project)的概念,着眼于现实,培养学生解决问题的实战能力。压博网页以研究实践项目的方式完成考核,在导师指导下,学生需要在限定时间内完成基于实际问题的项目设计和开发,并进行展示,实现心中创想,挖掘自己的学术潜能。通过项目实战,学生不仅能够更深刻地理解科学的研究方法,锻炼系统思辨、表达的能力,还能够收获真实的创客项目开发经历,作为其具备研究能力和将创想转为实际成果的能力的有力佐证。

灵活多样的压博网页设置

TechYoung 人工智能专修压博网页设置灵活多样。首先是压博网页内容和方向的灵活多样,除了基础的数学、计算机和机器学习理论教学,压博网页在案例研究和实践项目上为学生提供了丰富的选择空间,并根据学界和业界风向不断动态更新,学生可以在人机交互、自然语言处理、感知计算、自动化推荐系统、数据分析、计算机视觉等人工智能的多个应用领域自由选择感兴趣的细分研究方向;其次是授课方式的灵活多样,TechYoung 人工智能专修压博网页以Capstone Camp 集训营项目为核心,鼓励优秀学生接受实地、密集、系统的学术实践训练,在团队合作中碰撞创意火花;但同时,针对在时间、地点安排上存在困难、基础薄弱或更偏好一对一教学方式的学生,我们也提供周末教学的日常压博网页和弹性时间的线上压博网页,充分满足不同人群的学习需求。

2 压博网页体系

TechYoung 人工智能专修压博网页提供了三种不同的授课方式,为不同情况的学生提供选择。Capstone Camp 集训营项目在长假期开营,注重系统教学和实践,倡导与优秀同龄人的团队协作开发,有一定的考核要求,是TechYoung 人工智能专修压博网页目前的核心项目。Regular Course 常规压博网页是日常开设的线下压博网页,为不便在长假期上课或有一对一授课需求的学生提供学习机会,同样可以享受中科院的实验环境,由导师面对面教学,具有更高的定制性。Online Course 线上压博网页面向不便到校上课的学生弹性定制压博网页,在时间安排和教学内容上更为灵活和个性化。

Capstone Camp 集训营

以超小型压博网页(Seminar)形式展开授课的Capstone Camp 集训营提供系统的学术实践训练,从数学和计算机科学的理论入手,结合案例研究进行交互式教学,着重培养学生科学的研究方法和研究思维,最终用研究实践项目(Capstone Project)的形式完成考核。在研究实践项目中,学生需要组成团队,应用学习的理论,解决实际问题,并展示作品和设计报告。

集训营采取申请制和滚动录取,在长假期面向高中生和本科生分别开营,以6~10天为限,在中科院进行课堂教学和项目实践。结课后,学生将获得毕业证书和压博网页成绩单,对于优秀学生,出具推荐信,提供实习面试机会。

Regular Course 日常压博网页

周末开设的日常压博网页,在中科院以超小型压博网页或一对一的形式授课,以20课时为限,周期约一月至一个半月,手把手指导学生从零开始入门机器学习,并至少完成一个小型项目的开发。

Online Course 线上压博网页

面向不便到校上课的学生开设的远程一对一压博网页,以在线视频的形式授课,压博网页内容及授课时间根据学生情况量身定制,以20~24课时为限,周期约一月至一个半月,手把手指导学生从零开始入门机器学习,并至少完成一个小型项目的开发。

3 压博网页内容

以下是 TechYoung 人工智能专修压博网页的常规压博网页模块及其单元,涵盖从数学到计算机,从机器学习理论到应用实践的多个方向,确保系统性和丰富性。在具体的教学实践中,TechYoung 将根据学术界和工业界的最新动向不断更新知识体系,并根据学生的背景、兴趣和需求细化、深化地定制压博网页内容。

3.1 先修压博网页

先修压博网页讲授机器学习科研实践必需的数学理论和计算机实验操作方法,针对性地提供压博网页基石的教学,为后续理解打下坚实基础,构建连贯和完整的知识体系。

3.1.1 机器学习的数学原理

立足于实际应用,从微积分(导数、斜率、偏导数以及链式法则等)和线性代数(变量和系数、线性方程式,函数,对数和对数方程,张量以及矩阵乘法等)等高等数学基础知识入手,逐步过渡到概率论,讲授机器学习背后的数学原理,力争深入浅出、通俗易懂地呈现核心概念,最大限度提升学生的理解效率,让即使是仅具有高中数学基础的学生也能够通过压博网页获得对相关数学概念的感性认识。

3.1.2 计算机系统实验

基于开发实践的需求,讲授 Linux、Vim、Python、Git 四个模块的基础知识和基本操作。Linux 是主流应用及计算架设和开发的基础环境;Vim 则是 Linux 下最为基础、强大和流行的文本编辑器之一,也是 Linux 环境下的程序开发必须掌握的工具;Python 是目前的主流编程语言之一,也是机器学习中最广泛使用的编程语言;Github 则是广泛使用和在线代码托管和项目协作工具。通过本单元的学习,学生将初步掌握机器学习实战开发环境的操作方法。

3.2 机器学习基础

机器学习通过模拟和实现人类的学习行为获取新的知识不断优化自身性能,本模块从计算机的理论层次出发,教授机器学习基本概念、常用算法以及主流的机器学习工具,建立学生对机器学习的基本理解,并指导学生进行初步的开发实践。

3.2.1 机器学习理论及算法

介绍训练集、测试集、泛化、数据表示、特征组合、正则化、分类、无监督和监督学习等机器学习任务构建和模型评价的基本概念和主要术语,建立学生对机器学习的初步认识;在此基础之上,讲解决策树、贝叶斯、KNN、SVM、深度神经网络等机器学习常用算法,建立学生对机器学习应用背后计算机原理的理解。

3.2.2 机器学习工程实践

结合机器学习理论,介绍 Spark、Sklearn、TensorFlow 等机器学习的主流开发工具和构建项目工程的方法。本单元开始,进行基于案例研究的实践教学,从小规模数据集入手,指导学生动手搭建一个简单项目,在实战过程中更深刻地回顾和理解机器学习的术语和概念,了解和熟悉机器学习算法的使用方法。

3.3 机器学习前沿应用

根据机器学习在人工智能领域的应用方向,进行具体案例的深入研究和实践开发教学。学生可以自主选择感兴趣的方向,进行案例研究,在此基础之上发挥创意,解决实际问题,进行项目设计和实战开发。本模块将面向热点问题持续更新完善,以下仅介绍主要方向的典型案例。

3.3.1 AI 模型训练

五子棋 AI 模型

机器学习可以通过强化学习让智能系统实现从环境到行为的映射,例如学会下棋、作曲、玩游戏等。五子棋是机器学习 AI 模型训练的一个典型案例。本案例使用 Alpha 元算法进行强化学习,通过自训练实现五子棋 AI。

3.3.2 自然语言处理

自然语言处理交叉应用人工智能和语言学,探讨如何使用计算机分析、处理及运用人类语言。

情感分析

情感分析使用计算机的方法提前和识别文本中的主观信息,是自然语言处理的一个典型方向。本案例使用大规模数据处理计算引擎 Spark 的 MLlib 机器学习库,对 Twitter 的流数据进行情感分析,并可视化美国不同州属对总统候选人希拉里及川普的情感倾向,最终可以在地图上直观感受两位候选人的受欢迎程度。

自动文本摘要

原始文本通常带有许多冗余信息,自动文本摘要通过评分、聚类、数据重构等方法从文章提取或生成摘要,在处理海量文本时能够提高获取信息的效率。本案例使用基于图的排序算法 TextRank,实现对文章文本的自动摘要。

虚假新闻识别

互联网爆炸性的信息洪流泥沙俱下,虚假新闻既困扰着平台也困扰着用户,相比平台审查和用户报告等人力方式,使用文本分析算法识别虚假新闻是一种效率更高的手段。本案例通过机器学习对关键词进行特征提取,建立模型,筛选出虚假新闻。

3.3.3 感知计算

步态识别

手机、手环等移动设备的发展流行使得随时记录、监测人体数据成为可能,移动健康方兴未艾。步态识别是许多移动健康监测项目的基础。本案例通过移动设备的加速度传感器获取数据,并用数学方法从中提取特征,进行机器学习的训练,最终实现计步和对人体运动状态的判断。

3.3.4 推荐系统

互联网为用户提供了丰富信息的入口,但有时也带来信息过载的问题。推荐系统是互联网公司普遍使用的引导流量的手段,根据用户使用习惯判定其喜好,并进行内容或购物信息等的定向推荐。分类是推荐的基础。

短文分类

短文分类给文章自动归类,打上标签,实现对信息的迅速筛选。类别即标签,来自向量空间模型形成的句向量,用分类器预测得到。本案例使用 Sklearn 对短文进行特征提取和分析,实现对短文标签的自动预测。

电影分类

观众对电影的喜好受电影体裁、演员阵容、故事情节等多种元素影响,实现电影推荐首先需要对电影进行分类。本案例使用聚类算法,根据电影的演员、导演、体裁等信息预测电影标签。

3.3.5 数据分析

数据分析是机器学习的典型应用之一。

游戏分析

数据分析可以用以预测游戏胜负,例如英雄联盟、王者荣耀这类 MOBA 游戏,英雄的平衡性以及战队技术水平都对游戏胜算有较大影响。本案例以 MOBA 游戏为对象,使用分类器等算法对英雄平衡性数据以及战队过往赛事成绩的进行训练,预测对战结果。

赛事分析

紧随技术潮流,NBA 各球队也已经开始应用数据分析来更好地判断队伍和球员的状态,以针对性地制定科学的训练计划。预测赛事结果是其中的基本单元。本案例使用回归模型训练NBA赛事数据,预测单场比赛的胜负。

3.3.6 计算机视觉

计算机视觉是人工智能的一个重要领域。常见应用有笔迹识别、人脸识别等。随着机器学习和深度神经网络的发展,计算机视觉正处于空前的繁荣状态。

图片分类

图片分类是计算机视觉的基础。卷积神经网络是一种深度前馈人工神经网络,特别适合用于处理图像相关问题。本案例使用谷歌基于 DistBelief 进行研发的第二代人工智能学习系统 TensorFlow,通过卷积神经网络算法训练图片,实现自动分类。

人脸识别

人脸识别是图像处理与模式识别最热门的领域。自编码器和批梯度下降是图像识别的典型方法。本案例使用基于无监督学习的自编码器对人脸数据进行特征提取,再利用图片降维的结果作为监督学习分类器的输入,最终利用一个三层神经网络实现人脸识别。

3.4 机器学习进阶

面向学术热点和发展潮流,讲解机器学习更复杂的进阶算法和应用。

3.4.1 深度学习

深度学习是机器学习中一个备受重视的新分支领域,源于人工神经网络的研究,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,例如图像,声音和文本。它是一种特征学习方法,把原始数据通过一些简单但是非线性的模型转变成为更高层次的、更抽象的表达。目前最好的语音识别和影像识别系统都使用了深度学习技术,轰动全球的 AlphaGo 也是深度学习的作品之一。本单元将结合开发实践,介绍深度学习的历史、思想以及算法原理。

Copyright © xdua.com 2017 all right reserved,powered by Gitbook该文件修订时间: 2018-05-10 15:25:42

results matching ""

    No results matching ""