/images/avatar.png

911双子塔如何倒塌

我导师在911发生时恰好在美国交通部工作,随之参与了事故的一部分调查。同时我导师的博士导师MIT的T. Wierzbicki教授以及余同希教授当时对于这个话题有深入的分析和研究,两位教授后来发表了一篇文章在International Journal of Impact Engineering上,后来余老师又翻译其中的一部分内容发表在《力学与实践》上。 关于当天还有一个非常有趣的小故事:911当天我导师约了Wierzbicki教授和余同希老师在MIT讨论,结果到了办公室发现Wierzbicki教授居然不在,因为之前从来没有教授的迟到记录,过了半个小时,Wierzbicki教授打电话过来说"Turn on the TV”说他在家里看世贸双子塔的报道,会面延后。结果最后会面上三人一拍即合着力研究高楼的冲击动力学机制,所以才有了后面的两篇论文

这个问题问的非常好,但是首先要强调两点:

  1. 题主问“在短时间”的燃烧之后就倒塌了,其实隐含了一个非常有趣的关键信息,双子塔并不是在飞机撞上之后立即倒塌的,一般大家都会认为飞机的撞击载荷是一个非常大的载荷,但是其实不尽然。
  2. 对于世贸双子塔而言,其倒塌是逐层倒塌的,而实际上并不是说这个过程是不可抑制的,因为我们都知道在冲击载荷下材料会发生塑性变形是可以耗散能量的,而为什么世贸双子塔的倒塌过程是一个不可逆的过程呢?

关于飞机的撞击本身到底造成了多大影响,可以从力和能量两个方面进行剖析,根据文献中的计算得到的结论:

The energy absorbed by plastic deformation and fracture of the ill-fated column is only 6.7% of the initial kinetic energy of the wing.

也就是说,当时撞击中大楼所吸收的能量非常的小,只有机翼动能的 6.7%

另外,根据估计撞击速度应该为 500km/h,而按照考虑到大量燃油没有使用飞机的重量约为160t,其动能在 https://www.zhihu.com/equation?tex=1.54+%5Ctimes+10%5E9+J 。而撞入北楼的飞机在楼宽 https://www.zhihu.com/equation?tex=s+%3D+63.5m 的距离中被截停,其平均减速度为 https://www.zhihu.com/equation?tex=a+%3D+V%5E2%2F2s+%3D+150+m%2Fs%5E2 ,所以平均的撞击力 https://www.zhihu.com/equation?tex=+2.4+%5Ctimes+10%5E7+N

小记丰田暑期实习

https://pic4.zhimg.com/v2-cd5b84399821462921fe8491e47e7676_1200x500.jpg

本文为记录我于今年7月到8月在日本爱知县丰田市丰田研发中心一个多月的实习感想和经历,此为第一篇。

望着他们的背影从永田町地铁站入口的台阶渐渐隐去,我终于意识到,是时候真正说再见了。那日东京的最终报告会结束,意犹未尽的我们又约了一次“二次会”,那日,我们推杯换盏,似乎语言的隔阂甚至国别的差异都不再存在,时间似乎在那一刻停滞,却也又飞速的指向我们再度欢聚的未来。

https://pic4.zhimg.com/80/v2-344eccde18fa5652c977a679d348d25b_hd.jpg

我在最终的社内报告会如此说道,“感谢丰田让我能有如此珍贵的机会,让我能在短短一个月里由表及里、由浅入深去领略到一个工业巨擘的侧影,特别是丰田少有的展现给世人的一面——它的近乎执拗的坚持、出乎我意料的开放与进取以及每一个我所接触和所熟识的丰田的友人”。


其实我第一天的时候,是十分的紧张的,因为我所面临的课题是我所并不熟悉的自动驾驶和人体损伤,我甚至在临行前才匆忙浏览学习了他们相关的软件和文档,但是第一天我的GM(Group Manager)Hayashi san 就和我关于我的想法、我的研究经历以及他们的设想进行的非常深入的交流,在短短的一天之内就规划好了未来的研究计划,而我的指导者 Ando san 也同样给我详细讲解了 THUMS 以及他们所需要我所关心的问题。

其中一件很有趣的事情是不能携带手机,使得我们基本上从上午8点半到下午5点半的8个小时的时间里几乎都是在全神贯注的工作,我能深刻地感受到一心一意专注在具有很大挑战性的研究工作上的那种快乐——可能也是由于这样一个原因,很快就超进度完成了之前的研究计划,这使得我们有时间和精力在时间表里加入大量前往第一线的实验测试部门的参观和探讨,以及在研究计划中加入自己的内容。

https://pic3.zhimg.com/80/v2-127e272c0504b10ffed0b2576c150d52_hd.jpg

说到去实验部门的参观,这可能是我感触最深的一部分了,在我们短短的数周时间里,几乎每一天都有前往实验部门参观的行程,有整车的偏置和正面30度角碰撞,有假人的标定,有A柱、安全带的Rating的测试,还有座椅乃至发动机前罩盖的法规测试。去年在周青老师的 汽车碰撞安全基础(Mooc) 上所讲的种种概念在工程师的口中和我们进行讨论,种种我们所长期困惑而难以求证的实际测试的细节和关键都可以良好的讨论,甚至还可以针对诸如车辆在自动驾驶情况下的设计进行探究——很难想象——在风洞实验室里,我能看到汽车尾部所产生的卡门涡街的时候是多么的激动。不过,在这些实验和测试之外,我所深深感触到的是丰田汽车开发流程中现场实验人员和设计开发人员之间良好的沟通,在这里我看到的是,一线的实验人员能针对具体的设计和开发人员交流技术细节,开发人员反过来和实验人员进行实际应用的探讨。我记得在最初的见面会上,我们被告知丰田所崇尚的“现地现物”这一理念在这里就是最好的诠释,正如我在最终报告会上谈到自己最大的感受所言,“所谓工程科学的研究一定不能脱离实际,特别是汽车工程归根结底是工程技术的问题,需要考虑到方方面面从理论到实践的结合,缺一不可,而丰田这样一个坚持一切从实际出发特别是坚持本土生产的一系列举措都说明了什么才是在真正培养和孕育支撑国运的人才和产业的真正途径”。


https://pic4.zhimg.com/80/v2-9f05c37d6c64829c5bee78af3a5afce7_hd.jpg

作为系列的第一篇,其他方面我先不展开说,我最想说的就是我在丰田所认识的这些可爱的人们。在我参与的组内的第一次会议上每一个人都进行了非常认真和有特点的自我介绍,还记得组里的山田先生说自己“很自信满满”,于是我在最后送他的小礼物的信封上写了幼安那句“我见青山多妩媚,料青山见我应如是”,经过解释他表示非常适合他~ 还有林(Hayashi)先生每一次我们晚上一起活动结束后他都要亲自打车送我们回住处,也是从他第一次送我们的路上,我们开始了广泛而深入的交流,他谈到了他所骄傲的自己的儿子学业有成,还有自己的工作的压力以及自己对于未来的想法,“与君初相见,犹如故人归”是我给他的赠言。还有就是组内的CPE北川(Dr. Kitagawa)先生,虽然他职位和能力都非常高,但是他总是那么地平易近人,每天早上我去和他打招呼他都会起身微笑着回复我一句“おはようございます”,以及他不知道什么时候在我的上班记录旁边加上了几个音符——虽然其实日常的指导不是直接由他来进行,但是他对我的PPT和Poster都打印出来在每一页每一行上仔细地批注了修改意见,每每看到那份由他修改过的文档,我的心里都会涌起一阵暖流。

https://pic4.zhimg.com/80/v2-fa59a69bf65d3f10880d919726279a6f_hd.jpg


谢谢你们,让我体味了一个五彩斑斓而饱含回忆的夏天。不同于两年前我在东大透过图书馆的窗户所看到的那个夏天的日本,这个夏天,我开始认识到真正的日本,不同于东京街头的熙熙攘攘和象牙塔的大学,更重要的是,认识了引为毕生挚友的你们。

权且用Dr. Yasuki给我和我师兄的赠言共勉,祝你们“Eat well, sleep well and work well”,期待来日再会。

如何理解系统的可观测性

系统的可观测性的定义为:

对于系统 https://www.zhihu.com/equation?tex=%5Cbegin%7Baligned%7D+%5Cdot%7Bx%7D%28t%29+%26%3DA%28t%29+x%28t%29+%5C%5C+y%28t%29+%26%3DC%28t%29+x%28t%29+%5Cend%7Baligned%7D 在有限的时间区间里 https://www.zhihu.com/equation?tex=%5Bt_0%2Ct_%7B%5Calpha%7D%5D 内,对应初态 https://www.zhihu.com/equation?tex=x%28t_0%29+%3D+%5Cbar%7Bx%7D ,有

https://www.zhihu.com/equation?tex=y%28t%29+%5Cequiv+0%2C+%5Cquad+t+%5Cin%5Cleft%5Bt_%7B0%7D%2C+t_%7B%5Calpha%7D%5Cright%5D 则称为不可观测状态,如果不存在这样的不可观测状态,那么系统完全可观测。

这个定义说的非常的抽象,但是可观测性这个概念最重要的是其在 状态观测器(state observer)的设计中发挥了关键作用,下面我就从这个角度进行一些对于状态可观性的介绍。


其实,状态可观性的概念是出自于卡尔曼,而著名的Kalman filter也实质上是state estimator for stochastic system[1]

对于系统进行控制,首先我们需要确定要进行的控制的类型,一般而言,控制分为基于状态变量的控制和基于输出的控制,这其中最好的当然是状态控制,但是我们往往只有输出和输入,而难以直接得到系统的状态变量,这个时候就需要从前面所说的输出和输入还原出系统的状态变量,这就是所谓的状态观测[2]

https://pic4.zhimg.com/80/v2-060801e2b7592a23a3828b7046713790_1440w.jpg状态反馈和输出反馈

https://pic3.zhimg.com/80/v2-3266d61a72e80409f698d100d13f1805_1440w.jpg典型状态观测器结构

也谈清华学分绩改革和大类招生

一篇清青时报的名为《深度|谁动了我的GPA》一文在发出一小时被迅速删稿,引起了关于此事的不仅仅于清华学生的广泛谈论,彼时,看着这个问题下 如何看待清华大学清新时报文章“深度|谁动了我的GPA”一小时后被删除? 的许多回答,有经历的讲述,也有许多讥讽,那时我想让我们且看学校后续的应对吧,毕竟这么重要的问题学校肯定要认真研究,给出一个快速的反应和合理的处理——然而,当小五爷园发出这样一篇谈话稿回应学分绩改革 | 专访清华大学校长助理、副教务长彭刚,我才猛然想起,之前沸沸扬扬的2018年清华特奖风波的主人公依然没有被公布任何的处理结果,正如我在这篇文章也谈清华特奖一事中所说:

这件事的影响,之于清华,绝不是简简单单就是可以治愈的,真的不希望看到,在明年的秋天,特奖答辩上,再出现这样的情形。

窃钩者诛,窃国者侯。

希望学校能最终给出一个妥当的处置,就像我在回答里所说: “这一年来看到了太多关于清华的上限的东西 这一次 期待能看到清华的下限的高度

可惜,再一次,不再两次,我们都失望了。

不仅仅是学分绩改革,还有最近刚刚完成专业分流的大类招生改革。


关于学分绩改革,特别是那篇彭刚老师的访谈,许多人已经给予了细致的批驳,于是我就不打算针对细节进行回复,我想总体上写一点我和我所熟知的许多人所认同的东西。

清华进行学分绩改革,这本身没有什么过错,总体上来讲,学分绩的确有着可以模糊掉很小的分差,不需要让大家去纠结几分的差距,可以促进大家更关注课程的本身,而不是如何去多获得一分两分——是的,我说的是一分两分——现在的问题在于,无论是在现在的出国申请上,还是未来的推研过程中,都面临诸如这样的问题:

“考个89和考个90其实没差,但按新算法来就是B+和A-,3.3和3.7的差别”

访谈里有着这样一句话,“像量子力学这样的课,你可能拿80分就是4.0”我确实曾经上过物理系徐湛老师的量子力学,首先是不调分的,其次,拿80分以上的还真的超过1/3,所以这个意思是有1/3的人是4.0以上?

从学校的迅速删稿到套话和虚话回复中我们可以看到:要么学校是真的没有得知今年的申请状况,要么就是学校已然得知而有意为之。结合这几年越来越多的博士名额,或许从某种程度上讲,本科的学生,不出国留在自己这里读博士,似乎是对“建设世界一流大学”的终南捷径。

不由得想起已故华人物理学家张首晟曾在想做粒子物理的时候找到杨振宁先生寻求建议,然而杨振宁对这样一个优秀、极其可能可以继承自己粒子物理的衣钵的青年才俊却说出了“沙粒里也能看到整个世界”的话,极力推荐他去到新的凝聚态物理的领域中去,于是后来粒子物理果然进入寒冬,而张首晟也在凝聚态物理领域建树颇丰。

许多时候,我相信,大家讨论、争辩、甚至讥讽学校的政策,完全不是有意去中伤母校的名誉,每一个清华人都像爱着他的母亲一样深爱着自己的母校,大家想要的只是得到同样的关怀——甚至,可以比这更少:

比如,能真正关注到学生在出国申请时遇到的困难,予以良好的解决,而不是一种大而化之的态度,其实学校里已经有了一些成熟的机制可以学习(如星火)“一些名校申请结果好于往年”,要知道,对于学校,只是申请人数、申请名校数量这样冷冰冰的数字,然而,对于等待offer的每一个人,都是梦想的沉浮。

我们坚信和向往,清华会成为这样一个地方:在这里,你可以有不同的梦想,得到很好的支持,你可以在这里实现不同的人生可能,这里是一个关乎未来和梦想的地方。


说到不同的人生可能,就该说说我们的大类招生,本来最初我们以为清华的“人文日新”的口号含义是发展人文学科,进行文理兼修的培养,具体诸如扶持人文学科(这无可厚非,本来就是清华的欠账),建立和完善学校公选课,最后是新雅书院的成立——新雅书院本来应该是一个试点——然而,很快学校开始了在全校范围的大类招生。

我曾经在新雅的第一届学生新雅6字班的开班座谈会上发言时谈到”通识教育不是你要成为一个通识的人,而是要不断地去督促引导你思考你想要成为一个怎么样的人。通识教育,相比于传统的细分专业教育,在这个问题上可以引导的深度和广度有着先天的优势。”

三年过去了,看着这即将毕业的新雅第一届的学生们,我们可以惊喜地发现,他们中的许多,都选择了自己所真正热爱的方向——我看到其中有人穿梭于图书馆的巍巍邺架中,领会先哲的哲学思想,有人沉醉于组织自己钟爱的社团活动中,为院系乃至全校的同学们增加生活的亮色,更有许多,他们选择了艰深的量子物理,选择了纷繁的生命世界,或者选择了深奥的计算机科学,正如我的一位好友在和我讨论大类招生所说:

通识教育不应是在封闭的蕃篱内强加于学生,而是各院系基于尊重学生选择地普遍敞开。

然而,我们做到了吗?

我们所面临的是,“入学就是一个高四”,“GPA极高也会掉链子”,“各个院系规则不清晰”这样的质疑——我们的数理类、人文社科类、乃至计算机类的分流依然惨烈——而甚至闹出了诸如如何评价清华大学工物系将所有专业分为四(五)类优先级并进行转专业限制这样的问题。

本来大类招生的初衷是希望大家不要被专业所拘束,然而实际上却是划分了更加的藩篱,而提高了不同大类之间转专业的壁垒。

我们大家都在问,希望有一个更加合理的大类招生政策,这是对的,可是,我们是曾想过,这大类培养的一年,我们从“大类培养”中收获到了什么?是学科的通识,是高屋建瓴的视野,还是更加艰难的竞争?

特别地,这个问题下一个普遍的观点是关于“专业鄙视链”的问题,此处我想要予以驳斥。许多人总是把清华的诸多除了信息专业之外的工程学科列为所谓的“失败专业”,并加以引申扩大,此处我想引用自动化系刘烨斌老师上课说的一句话“你在清华这四年,一定要去选择你所真正热爱的事情,或许,你就选择好了你毕生的方向”——

没有一个专业是失败的,也没有一个学生是注定失败的,只有不合适的选择——而清华应该有的,是不拒绝任何一个选择和选择的理由——甚至这个理由可以是简单的“我想要拿到高薪”——回到上面所说的工物系的规定,一个“世界一流大学”的院系应该做的不是固步自封,想要构筑牢笼来圈住自己学生的选择,而是懂得如何进行发展和转型,去更加适应这个时代的发展。


最后我想起了不久前上映的《无问西东》,其中所试图去传达和塑造近一个世纪以来中国知识分子的群像却真的是当下清华人“建设世界一流大学”所最应该珍惜和爱护的东西,这个东西: 在吴岭澜这里,是和梅贻琦谈论后所终日思考人生的意义的时光;

在沈光耀这里,是徘徊彷徨于母亲愿望和共赴国难之间的进退;

在陈鹏这里,是和众人一起扔石头还是自己选择坚持自己的心中挚爱;

在张果果这里,是放弃四胞胎一家和选择和之前的上司一起尔虞我诈;

或许,这些小人物的故事没有当年钱学森毅然登船归国、邓稼先戈壁十载这样的故事慷慨激烈,甚至起初会显得自私、局促、狭隘和平凡,但是这种故事,却是绝大多数清华人、北大人乃至中国从古自今的知识分子真实的心路历程。

而这其中,吴岭澜的困扰和纠结,恰如其分的展现了在历史的角度下,清华人面临诸如专业选择乃至出国深造、留在国内诸多重大选择的内心波澜。

吴岭澜的困扰和纠结,不仅仅是一种个人对于自己选择文理的追问,而是扣合了“立德立言,无问西东”的主旨,这种描摹,有如屈子的《天问》,是每一个知识分子在其成长道路上所需要面对的重大抉择,作品本身甚至没有给出答案,只是给出了“真心”这样一个十分模糊的答案,在我看来,这呼应了中国知识分子自古以来的理想:“为天地立心,为生民立命,为往圣继绝学,为万世开太平”——尽管十分的模糊,但是每一个人所做的思考和抉择都给了它十分独特的含义——如钱三强,如邓稼先。

就如我之前写下的这段文字:

要说在抗战的烽火中,中国士兵们面对日寇,没有丝毫的怯懦,大致是不准确的,中国人从来都是畏惧死的,因为珍爱生命乃是人性,只是他们从小就知道“覆巢之下,岂有完卵”这样的道理,如沈光耀,纠结于父母之命,己家之安,但是他依然选择了为家国而亡。 描绘那段奋力研究原子弹和航天的作品汗牛充栋,有怀抱样弹碎片的邓稼先,有居功至伟的钱学森,不过,依然陈鹏在火车上帽子中掉落的头发还有对小女孩的会心一笑,似乎预示着为什么这几件事情能如此给我带来这样大二持久的震撼:自从鸦片战争以来曾经响起在广州港、大沽口、黄海海面、黄浦江的炮声,曾经盘旋于北平、上海、重庆、西安、太原的轰炸声终于画上了句号。

今天的清华,大可不必担心自己的学生选择什么专业,去到哪里深造,当面临时代呼唤时,他们的当中会依旧出现如当年毅然归国的钱学森、郭永怀一样的敢于担当者,只是,清华需要给自己的学生更多的空间和真正广阔的平台。

同样借用清华校歌结尾:

服膺守善心无违。

关于清华大学评选的首批标杆课程

清华标杆课教师 | 物理系徐湛:用赤诚之心教给学生看家本领

先放张徐湛老师的量子力学结课合影(手动艾特当时认识的大佬 @刘书玮

https://pic3.zhimg.com/80/v2-af34b4b39ccbc4ad28fae07dd82dd96d_1440w.jpg

作为一个非物理系的选修徐湛老师的量子力学,可能我的体会和感受会和物理系的同学有所不同的

我记得当时是我先修了倪军的统计力学然后才去上的量子力学,不过在上统计力学的时候就看过了 David Tong 的 QM 的讲义,当时对于量子力学的认知还是仅限于费曼三(但是后来我才发现费曼三其实我完全没看懂……徐老师的费曼三讲的据说也非常好 不知道现在研究生的我有没有机会去旁听一下)。说的有点偏了,说回来,当时选了量子力学之后,被一众大佬推荐了 Shankar, Sakurai 和 Griffith,于是假期先看了一部分,但是看 Sakurai 完全看不懂。

但是上了徐老师的课,像是开启了量子力学的大门。

徐老师严谨授课,学识

**渊博。**徐老师上课有个特点,总是遵循最基本的原理和最简洁的表述,从他讲基本定理的时候就是如此,到后来讲到 CG系数、角动量的时候也是如此,能将其实相对比较复杂的概念讲的十分清楚,算是很有功力。我记得几乎每节课我们都有很多人找老师答疑,多是有所拓展,我还记得当时我请教了徐老师一个声子长程关联作用的问题,他认认真真给我讲了十分钟,还指出了我如果研究的话可以从哪些角度入手。实际上,这样的交流氛围,即使在我们崇尚交流和发散的钱班内部也是少见的。

其实我当时一度以为,老师为什么不多拓展一些,也不要那么地严谨,后来直到我试着读 Dirac 的时候才发现,当年的徐老师是在培养我们的物理范式和思维习惯。

当然,除了对于物理学的严谨,徐老师也鼓励我们做大胆的假设,物理系有一句流传很久的名言:“好的物理学家做合理的近似,伟大的物理学家做不合理的近似。”(王亚愚),徐老师讲到散射理论和微扰计算的时候,都很注重让我们体会其假设的合理性和适用性。

其实最让我印象深刻的还是当时正值“凡伟”一事发酵,在一节课下,平时几乎不做课外评论的他给我们说出了这样的感受:

徐湛老师对于凡伟一事的一个评论

“我只发表一个评论,就是各位同学在自己的学习和科研中,特别是如果以后要从事基础物理的研究,所应该明白的一个东西,这个法则你们早就听说过,但是我觉得你们可能不是真正明白它的确切含义”。 “实践是检验真理的唯一标准。我们都知道,物理学的理论必须要经过试验的验证才能被证实,这也是我们大多数人对这句‘实践是检验真理的唯一标准’的理解,但是这其实只是这句话的一半含义,甚至是不那么重要的一半。重要的一半是,物理学的理论,不仅仅需要满足已有的实验结果,更重要的是,要能够对于未来的现象和试验的结果做出预测,从而指导我们下一步的行动。就如同当年张守晟提出‘量子反常霍尔效应’,后来被薛其坤试验验证,杨先生评价这是‘中国实验室里的第一个诺贝尔奖级别的实验结果’,其实很重要的是,这是一次对于理论成功预测试验的验证。” “我文革被下放到农场劳动,做了五年电工,我自己大学学习的是核物理专业,当时面对厚厚的一摞国家标准、工程规范,我的脑子里只有我学习过的麦克斯韦方程组,但是我知道,这些就是我必须要掌握的,而且要不打折扣的去执行的,而且多年的实践已经证明,基于电磁场等物理学理论所建立起的现代社会的各个行业、方方面面的规范和方法,很好地保障着和推动着这个社会的发展。你要说,你改写了教科书,那么就请你去电机机械厂,用你的理论指出我们原来的这样一套理论所建立的这些规范和方法,哪里不对,甚至是一点点的改动。”

当时我在上面那篇分享的结尾这样写道:

“我觉得,这段话说来掷地有声,很有道理,并且也说出了为什么我自己对于物理学一直钟爱的原因,正如我在题图中的那句谢耳朵的名言所言,“I am a physicist and I have a working knowledge of the entire universe and everything it contains”

能得这样的老师而受教,实在是莫大的幸事。


放个彩蛋

https://pic2.zhimg.com/80/v2-e77f1e0678967bdd68d7a60f77ea2357_1440w.jpg

基于信令数据的人口时空分布模型构建

上学期和一众小伙伴一起完成了一个基于北京市手机信令数据历史分布来进行未来人流分布的模型的构建,在将近一个学期的项目中,在一次次的交流、讨论和修正中学习到了很多,于此进行一个概要的总结。

项目代码文档

项目报告

项目背景

对于城市特别是大型城市而言,预测人口的流动和分布变化对于城市交通治理、公共安全和危险评估都有着重要的战略意义。而由于其受到诸如区域间交通、突发事件、天气等复杂因素的多元影响,利用传统方法对于其进行预测十分困难。

我们将城市分割成均匀网格,基于交通、气象、时间和事件等多源信息,设计了期望输出为驻留人数、出发人数、到达人数有监督人工神经网络,综合预测未来每个网格的人口变化。网络的输入为数据的特征,通过对于数据的预处理和分析我们认为主要需要考虑短周期特性、长周期特性和异常情况的影响三个方面的因素。同时我们以获得数据中的驻留人数作为标签,利用期望输出与网络输出之间的误差建立学习信号反向传播,修正网络权重,最终得到了相对较理想的预测结果。特别是在预测精度方面相对传统方法有着显著的提升,并且对于特定地区的人流异常的预测也表现出了较好的效果。

技术路线和技术难点

所主要面临的技术难题有下面几点:

  • 数据结构的转变:如何将手机的信令数据向人口分布和流动数据进行转变,其中的抽样代表性如何保证。

缺失值的处理:对于数据中的缺失值如何进行处理,同时也要考虑算法的适用性和对于缺失值的敏感性。 + 额外数据的补充:依据所采取的算法构架,其中所需要得到的额外数据的补充。 算法的预测精度和计算效率的博弈:如何在算法的预测精度得到保证的前提下进行计算速度的提升即算法的优化 + 数据的预分析和预处理: 面对繁杂的原始数据,除了进行一些初步的数据清洗之外,在进入到算法架构的设计和选择之前需要进行数据内在规律的发掘和总结,这样才能较好地得到好的算法设计。

我们分为时间上的周期性,相邻格点的关联性乃至诸如天气变化和节假日等所谓异常时间对于人口分布的影响进行了初步分析,其结果如下图所示:

可以发现:

人流的时间周期明显地分为短周期和长周期等不同周期性的变化,如周内工作日和周末的周期变化,还有不同周之间的周期变化(由于我们拿到的数据的原因,没能体现出我们所推测的季节性的年度周期性变化) 相邻地域的人口动显示出一定的关联性,导致这一问题展现出时空上耦合关联特性。(这也导致初始预分析中所采用的常常用于时间序列分析的ARIMA模型预测效果较差) 节假日和天气等因素也会对人口分布产生影响,从而要加以考量 简而言之,我们所考量的物理量(人口)其影响因素由下面几个方面组成:

$$ \bar{\mu_i} = \mu_i + \psi_{i,w_t} + \theta_{i,h_t} $$

三部分分别代表上面所说的三种因素的影响(当然这里的简单加和可以加以讨论)。

在最初的预分析中,我们首先构建了一个简单的用于时间序列分析的模型(也就是将整个北京的数据分为孤立的格点按照时间序列分析的方法进行分别分析),其结果如下:

可以发现,该方法可以预测趋势但是存在较大误差,其可能原因是源于序列的时间相关性可能是跳跃性的,即某时刻的数据可能与1小时前、2两小时前、24小时前、48小时前、一周前的数据等相关性更高,而不是与之前的数据随时间间隔增大相关性逐渐降低。另外这类模型不能考量其空间相关性,想要考量天气等额外因素更加困难。

残差网络人口预测模型构建

问题建立

对于人口数据,其直观的显示是如下图中显示的按照地图进行划分,而在我们的模型研究中,将其划分为沿着经纬线划分的M × N矩形网格

模型划分

本问题实际上是一个回归分析问题。

模型理论基础

模型采用的深度残差网络相比传统的卷积神经网络可以有着更深的结构层数 ,而实践证明其在图像分类、物体识别等问题中有着相当好的应用效果 ,所以我们基于这样的网络结构进行模型的搭建。

一般地,在残差网络中可以将回归预测模型的问题定义为:

$$ X^{l+1} = X^{l} + F(X^{l}) $$

网络的目标就是找到合适的残差函数 $F$ ,下图展示了一个典型的残差单元:

本研究所采用的残差网络的架构,在时间周期层面上考虑小时、天、周三个不同层次的影响,并利用卷积考虑空间上的相互关联,最后再加入外部因素的影响。模型分别采取预测时刻的最近三个小时、一天前的四个小时和一周前的两个小时的数据作为输入,在网络中得到不同的权重,再计算残差实现反向传播。

在实际的网络设计中,考虑到城市不同区域之间的相互关联(如依靠地面公路、地铁的流动)进行卷积核的大小的调整和对于激活函数的定义。

下图是残差网络的示意图:

基于上面的结构图,其中一个需要补充的问题是数据的融合,在实际中,模型中的三个不同时间周期的数据可以用参数矩阵的方法进行混合。

具体的算法见框图:

结果分析

将模型的预测结果和下面两种基线结果进行比较:

• 插值方法(naive model):用历史平均来插值预测,对于某一ID,某一周,某一时刻,计算它的历史平均