我并不是“一个人在战斗”:这是工业大数据开拓者们的故事

2019年7月22-23日 ,由工业和关键是因为信息化部指导  ,国家关键是因为信息通信研究工作院主办的第三届“国家工业大数据情况创新竞赛”(以上简喻为“竞赛”)决赛现场人员答辩及颁奖仪式北京大大辽宁大厦落下帷幕。更成首个由政府主管部门指导的工业大数据情况三大领域 的权威性省市赛事 ,竞赛已少于驻足观看产学研各界少于6000人参赛 ,开声响第三种 聚焦行业内细分三大领域 的算法模型  ,问题不少现代工业三大领域 中是“老大难”问题。上次  ,InfoQ 专访第三届工业大数据情况竞赛冠军合作团队胡翔  ,其它 其它 腾讯体育首尔学校的国际合作团队 tea  ,深入解读在工业大数据情况与智能制造三大领域 中这群开拓者的传奇故事。

我并如今“另如今人在战斗”

更成决赛最好的特别大对一参赛者 ,当提起“以一敌百”重大成效冠军的荣耀时刻时  ,胡翔调侃道  ,“如今我并如今‘另如今人在战斗’。”

然而着竞赛数十只支多人队伍同场竞技  ,胡翔堪称如此如此单人参赛既有整体优势就有整体优势。中是  ,整体优势是因为对一对比赛中部门工作的安排更加自由灵活  ,就有就会更加专注  ,而对每另如今这个想法总能亲自尝试与验证  ,这导致第三种 对问题的详细解释它能更加的透彻、深入。

如今 ,“人多的力大”这句老话也确有道理  ,单人参赛相对比于多人合作团队 ,才能才能去做更很很不错及分析部门工作  ,也更加有巨特别大压力。如今对一的详细解释它强悍不足此般单一 ,更不 一样思路的碰撞 ,思路会更十分容易陷入壁垒。“但很幸运值得一提在因联科技 ,我身旁的同事给了我第三种 帮助你  ,如今的对另如今问题的详细解释它和思路给了我第三种 启发 ,如今我并如今‘另如今人在战斗’ ,的那里处向如今的堪称如此如此感谢。”

2018 年  ,胡翔毕业后后于西安交通学校机械工程学院  ,入职于西安因联关键是因为信息科技  ,并于 更成我这位工业算法工程师。关注更多更多工业大数据情况相关联关键是因为信息的他  ,在看见第三届工业大数据情况竞赛报名的关键是因为信息后  ,毅然会考虑“单枪匹马大练兵”。

而对“练兵”的含义 ,胡翔的说:“练兵有个层含义  ,第三点 而对锻炼第三种 问题工业及分析性维护问题的强悍不足。第三点 在工业及分析性维护三大领域 部门工作半年多后  ,以比赛中第三种 形式去问题实际问题  ,而对自我业务强悍不足的整体整体综合水平  ,是另如今此般不很很不错良机。如今比赛中的综合水平 是此般高的  ,才能才能相识不少优秀的同行。”

第三届工业大数据情况创新竞赛冠军 胡 翔

不很很不错的解题思路是问题问题的“灵魂”是因为

工业大数据情况创新竞赛自 2017 年首届不参加一年以来  ,每一届竞赛都为参赛者提供更多着基于真实工业场景的数据情况资源  ,并为工业大数据情况三大领域 的研究工作工作人员和创业者们提供更多了成果转移转化的交流平台最新发布。

“如今上次竞赛的数据情况  ,均转自于沈鼓大型高速旋转机组实际运行中是真实数据情况 ,故障案例此般宝贵  ,”胡翔对澎湃新闻的说。据相识了解  ,胡翔的部门工作第三点 集中在振动减慢和加减慢数据情况的及分析上  ,这时从未获取过此般大量地个大机组振动位移数据情况并对及分析 ,当澎湃新闻询问胡翔重新交出 赛题与数据情况后的第三反映  ,胡翔堪称如此如此“此般惊喜”。

早在 2019 大数据情况产业峰会  ,国家通信研究工作院就最新发布了首道主赛区赛题——由沈阳鼓风机集团测控其技术有限一家提供更多更多的《大型旋转机组转子部件脱落故障及分析》。但看见赛题后的胡翔  ,并未着急着手“解题” ,也也许你先选定了另如今不很很不错的解题思路后  ,再并对攻克。

“我对一堪称如此如此解题思路实际是问题问题的“灵魂”是因为。不论要在 上次的比赛中中如今日常部门部门工作  ,任何问题的问题如今依赖于正确的解题思路。”胡翔总结道 ,才要在 详细解释它它赛题大目标和数据情况的基于上  ,才能选定另如今不很很不错的解题思路  ,不很很不错的解题思路会对数据情况及分析和特征提取提供更多此般不很很不错方向中。

其它 其它 而对工业三大领域 的数据情况挖掘比赛中 ,第三种 选手一慢慢就确立值得一提纯数据情况的及分析和挖掘  ,几乎没两者结合机理及分析  ,仅仅是提取了数据情况各个统计特征 ,堪称如此如此并对了多个模型对随后并对两者结合。如今如今许能重新交出 此般不很很不错随后  ,但第三种 模型并如今“洞察力” ,第三点 特征而对模型随后的详细解释力也也许你强  ,第三点 第三种 模型比较难与人构建信任 ,尽管好尽管好如今训练出另如今准确率为 99% 的模型 ,不过比较难重大成效成功在工业实际场景中落地实践。

打破专家定论——新常见方法问题老问题

上次竞赛赛题《大型旋转机组转子部件脱落故障及分析》均属工业三大领域 均属的异常检测和故障诊断问题。旋转类机械设备的故障诊断问题在实际的工业场景中此般常见  ,转子部件脱落也都另如今老问题。

据相识了解  ,比赛中数据情况提供更多方沈鼓负责人曾在阿尔斯通的那时就碰上过另如今问题  ,并就该问题与欧美专家并对讨论 ,当初 的结论更不 如今并对传感器的信号及分析出故障。但不过不过令人惊喜值得一提  ,在比赛中中不少优秀的选手和问题方案 ,用不一样的常见方法努力实现转子部件脱落的故障及分析 ,打破了当初 专家的定论。最好的好的让在场专家评审印象深刻的要属冠军合作团队胡翔的问题方案。

要说胡翔的问题方案 ,重中之重如今在重新交出 赛题数据情况后 ,对原始工业数据情况并对了就有数据情况的整合和数据情况的可视化的预处理完成。如今工业数据情况的复杂性 ,数据情况集也许你数据情况测点名称与测点数据情况不一致的问题  ,如今的第三步他先对数据情况并对了基础标准化整理 ,将测点名称基础标准化;第三步而对振动位移数据情况并对可视化及分析  ,会会考虑大机组的振动采样特性  ,其它 其它 均属的位移振动及分析常见方法是因为  ,并对总采样点与转子旋转周数相除 ,得慢慢采样频率为每转 32 点(等角度采样)。

在获取采样频率后  ,以此 FFT 变换获取位移振动阶次谱  ,并观察故障样本和很正常 样本阶次谱的差异差异  ,为特征提取提供更多方向中。竞赛中  ,胡翔在阶次谱中提取了 1 倍转频  ,2 倍转频 ,3 倍转频等特征 ,并观察如今特征在有故障机组和无故障机组中从历史趋势  ,因而选择方式 能有效特征。就有参照 转子 X 向和 Y 向位移  ,合成轴心轨迹  ,惊奇发现无故障机组的轴心轨迹在各个时段变任何如今较大新的变化 (如图 1)  ,而转子部件脱落故障的机组的轴心轨迹在各个时段心理心理历程较大新的变化 (如图 2)。

图 1 无故障机组各时段均属轴心轨迹

图 2 故障机组各时段均属轴心轨迹

此后  ,胡翔别出心裁地把赛题拆解为“转子部件是也许你脱落”与“脱落故障征兆强度识别”另如今大部分  ,并并对问题二分类问题与分类概率大小排序问题  ,三个问题赛题的两大难点。

中是  ,问题二分类问题所然而的挑战是因为数据情况集的划分  ,是也许你选取训练数据情况集  ,对随后的将给影响此般之大。如今理论上转子部件脱落故障征兆在最少于故障再次发生时刻可圈可点最强  ,最少于故障把时间的数据情况与实际故障数据情况如今最相就如  ,如今的胡翔在解题中选取了最少于故障把时间的数据情况更成二分类的正例数据情况并对训练。

在分类概率大小排序问题中  ,最特别大挑战莫过尽管好也许你筛选特征  ,如今特征选择方式 双方关系到模型的性能随后和泛化强悍不足。会会考虑赛题大目标是区分故障征兆强度  ,而对机械部件故障而对  ,越少于故障再次发生时刻  ,征兆的可圈可点如今越强  ,如今特征若是与故障把时间呈现较强的单调性 ,既能区分故障的强悍不足如今越强  ,也越能区分故障同样处于哪种同时。综合以上及分析  ,选择方式 故障数据情况中单调性更强的特征并对建模和及分析为最佳问题方案。尽管好尽管好都重大成效了此般不很很不错随后  ,胡翔的如今思路和方案在答辩中是得慢慢多位评委的重新交出 和赞许。

但胡翔也堪称如此如此第三种 算法模型其它 其它 第三种 不足才能才能改进与完善 ,算法模型的精度上还才能才能整体整体综合水平  ,以不不能满足工业应用来过更高也总能求。算法模型也才能才能会考虑除“转子部件脱落故障”其它 其它 的中是故障对算法模型的将给影响  ,才能问题了另如今组成部分问题  ,算法模型才能如今在工业实际中重新交出 应用。

全球性市场参赛选手同台竞技  ,各领风骚

第三届工业大数据情况创新竞赛已重大成效成功落下帷幕。但值得一提值得一提  ,本届竞赛堪称我十场才能意义上和全球性市场竞技  ,国家关键是因为信息通信研究工作院更成全球性市场工业大数据情况三大领域 顶尖活动会—— PHM 亚太学术论坛(www.phmap.cn)主办方更成  ,赛题其它 其它 全球性市场参赛选手和全球性市场参赛者同台 PK ,而腾讯体育首尔学校的参赛合作团队“ tea ”也都重大成效了第这位的好重大成效。

tea 小组是由腾讯体育首尔国立学校机械工程系的学校 Yongjin Shin、Jongmin Park 与 Yongjin Shin 共同组成。在拒绝接受接受澎湃新闻拒绝接受接受时  ,tea 小组的成员们谈起这段参赛心理心理历程时  ,感叹道:"Since we are students in the lab, we often use experimental data or refined data. However, it was a good experience to analyze and build the model by directly using the data measured in the industrial field without any filtering. (如今如今值得一提实验室的中学生 ,并对到的大大多数数为实验数据情况或处理完成后的数据情况。随后并对工业三大领域 中测量的未经处理完成的数据情况来及分析和建模我一段很不很很不错心理心理历程。)"

第三届工业大数据情况创新竞赛韩国参赛合作团队 tea 小组

据相识了解  ,如今是 tea 小组第上次来国家不参加此类比赛中。而对如今的而对  ,上次竞赛的最小挑战是因为  ,给定的数据情况集要在 转子部件脱落故障这时采集的。如今  ,在及分析数据情况的变化变化同时  ,比较难检测到故障再次发生的特征  ,并选定未故障到少于故障的顺序。而而对更清晰的判断  ,tea 小组在解题初期也想过并对机器来学习或其它 其它 其它 模型(如今第三种 成员的第三点 研究工作方向中是 PHM 三大领域 的深度来学习)  ,但如今标签关键是因为信息如今会如今上诉问题更加不清晰 ,tea 小组设定了如今基础标准 ,以选定是也许你故障及故障的顺序。

也都 ,而对实如今实际工业场景中是应用 ,tea 小组堪称如此如此  ,如今的才能对给定大目标系统提供(的特定故障)加设更不 很很不错的故障基础标准或阈值  ,算法模型都要从大目标系统提供中就有获取很正常 和故障的数据情况  ,并加设选定基础标准以区分是很正常 如今故障  ,努力实现模型的逐步优化与改进。

近年来 ,在工业 4.0 的发展中趋势下  ,韩国和国家就如  ,随着时间高附加值其技术组成部分性的整体综合水平  ,变化同时自动化其它 其它 相关联的自动故障诊断和及分析系统提供也将更加此般组成部分。

写在随后

智能制造和工业互联网是密不可分的双方关系。正如胡翔所说  ,及分析性维护是工业互联网应用来过“皇冠上和明珠”。如今远远不止此般 ,大数据情况和智能制造给现代工业将给了较大冲击  ,强较大工业数据情况及分析附加服务将更成制造中小企业 数字化战略的组成部分组成大部分  ,工业互联网将显现出更很很不错战略价值意义。才能才能预见  ,工业大数据情况应用将将给工业中小企业 创新和变革的新化时代。