A8:在线教育总第4554期 >2019-06-13编印

栗浩洋:松鼠AI靠算法和数据“因材施教”
刊发日期:2019-06-13 阅读次数: 作者:  语音阅读:

自适应教育(adaptivelearning)是目前在线教育行业备受关注的概念,但对大多数国内用户来说,仍然很陌生,甚至存在不同程度的误读。事实上,在美国,自适应教育已产生近30年,发展逾10年,到目前为止,全球已有超过9000多万用户在使用相关产品。

通俗来讲,自适应教育可以理解为个性化教育,是大数据、人工智能在教育中的深度应用。松鼠AI创始人栗浩洋对中国金融科技专刊表示,现在很多宣称在做人工智能自适应学习的公司,其实只是混淆视听,事实上,自适应学习并不是一种新概念,其本质是“因材施教”。 强大产品研发体系提高效率

据了解,松鼠AI成立于2014年,是国内首家将人工智能自适应学习技术应用在K12教育领域的人工智能公司,同时也是将国外前沿的adaptivelearning带回国内的先行者。其开发了国内第一个以高级算法为核心的人工智能自适应学习系统,相关介绍称,该系统拥有完整的自主知识产权。

松鼠AI对标美国Knewton,但“松鼠AI不是从美国复制过来的公司”,这是该公司首席科学家TomMitchell教授的评价。TomMitchell教授同时是美国卡耐基梅隆大学(CMU)计算机学院的院长,CMU位列全球人工智能研究领域第一。授课形式上,松鼠AI采用线下班课的形式,但教学部分是在线上完成的,由线上(系统)中的“AI老师”负责教学授课,线下有真人老师进行辅导,负责答疑解惑和学生心理辅导等工作,这些老师扮演着类似于辅导员或班主任的角色。目前,根据该公司5月最新披露的数据,松鼠AI在国内 20多个省市自治区共计200多个城市,有1900多家学校,注册学生数超200万。值得注意的是,在产品研发方面,松鼠AI将学科中的知识点进行超纳米级知识点拆分,在学习的过程中实时检测孩子的知识薄弱点,并通过建立知识地图理论模型,对非关联性的知识点之间进行关联概率,同时用错因重构知识地图,清楚地标注每一道题不同的错因,更加精准地给出最适合每一个孩子的学习路径,从而提高学习效率。

在技术层面,智适应学习系统的底层算法和技术包括遗传算法、机器学习、概率图模型、贝叶斯理论、图论、知识空间理论、信息论、知识追踪理论、教育数据挖掘、学习分析技术、神经网络技术、逻辑斯蒂回归模型,学习系统包括学习数据分析、行为数据分析、学习目标规划、学习内容管理,应用层包括多模态行为分析(MIBA)、对话、虚拟个人助手(VPA)。

可以说,如上技术都是人工智能领域发展中最重要和最前沿的内容。为了能够更好地开展技术探索,松鼠AI还花重金从全球聘请了AI领域的顶级专家学者担任顾问,与斯坦福国际研究院、中科院、美国卡耐基梅隆大学等成立联合实验室,开展相关领域的科研工作。

在今年的第三届AIAED大会上,松鼠AI正式聘请美国卡耐基梅隆大学(CMU)计算机及心理学系教授KenKoedinger为首席学习科学家,后者在机器老师领域有着几十年的研究经验,是90年代认知导师(cognitivetutor)的联合创始人之一。

多维度分析优化算法

人工智能是改变教育的一个重大力量,但现在人工智能聚焦的领域更多的是在视觉识别、NLP(自然语言处理)等方面,已投入了大量的人力、精力,产出了大量的论文,但真正应用在教育领域,相对来说还比较少。“AI+教育在全球发展的速度已经非常快了,但是在中国还几乎没有人知道。”栗浩洋深信算法和数据对教育的变革,他表示,松鼠AI要做的事情很多,我们不仅仅要像今日头条一样,做每个学生的用户画像分析,知道每个孩子的状态,我们还要像今日头条一样,去做判断,就是到底给他进行什么样的推荐。但同时,我们的算法比今日头条的更难。对于今日头条来说,它只要给你推荐合适的内容就算成功了,你看完了之后是100%理解了还是只理解了10%,它根本不在乎,只要你花费了时间进行阅读就是算法的成功。而我们要保证学生掌握这个内容,如果学生没有学会,就不是成功。

数据是支撑算法的核心,没有数据的人工智能是无法产出有效结果的。在教育数据的挖掘和分析方面,松鼠AI正在展开研究,通过对学生用户的多维度的行为数据分析,更好地优化算法。

发力学生数据保护工作

与国外相比,国内的自适应教育起步较慢,但优势也显而易见。TomMitchell教授认为,从技术上来讲,全球各国的机器学习都差不多,但中国的一个特别大的优势是数据体量非常大,有了如此大的数据量支撑,对研究和机器学习的训练速度会增长很快。另外,中国大部分的家长都非常重视教育,这也是中国的教育数据量非常大的原因,由于这两方面因素,后续在机器学习上的发展前景会很大。

当然,在谈及相关法律法规时,TomMitchell教授对本刊表示,数据收集方面最重要的法规就是隐私保护,在美国,学生的信息都会进行去标识化处理,与松鼠AI合作时也是这么严格执行的,从而更好地保护学生的隐私。

TomMitchell教授以自己的医疗数据做类比,他表示,目前在解决学生数据保护的问题上还有很多工作要做,现在并没有一个完全的答案,但就像医疗数据一样,在过去的许多年当中,我的医生有关于我的全部的医疗数据,但是这套数据对其他任何不相关的人都是不开放的。



(消费日报 www.xfrb.com.cn)