SAECCE 2020 | 丁晓华：如何利用平台对电池实际的健康状态评价-58京牌网

SAECCE 2020 | 北京航空航天大学杨世春：动力电池安全性能评估与预测

2020中国汽车工程学会年会暨展览会（SAECCE 2020）于2020年10月27-29日在嘉定上海国际汽车城-上海汽车会展中心举办，汇聚汽车及相关行业的企业高层、技术领军人物、资深专家学者、广大科技工作者。10月29日，上海市公共数据采集与检测研究中心副主任丁晓华在本次大会上发表了主旨演讲。

以下为演讲实录：

我主要讲三部分，一块讲我们有什么数据和车辆，第二块讲讲SOH从大数据方法怎么做，第三块说说我们不仅仅是做项目的平台，更关键是有数据，如何让大家来使用，所以从这里头来讲如何利用平台来开发对电池实际的健康状态的评价。

这是32960，大家都知道，30秒或者10秒，国家大数据平台和我们这个地方平台都有，全国的地方平台不只上海还有很多家，大家都有这个数据。现在用的比较多的就是整车数据、空间数据和电池极值数据。上海又在修改地标，大家知道如果一旦做离散性或者不一致性，和做电池的衰减，特别是事后的一些报警的分析，靠30秒调速就很难，10秒一调速依然很难，所以我们现在地标修改成1秒一条数据。为了更好做分析增加了所有电池包里面的单体的所有电压和整个包内的所有探针，国标里头只有一个包内的最高、最低电压值，而这个在实际后面数据分析中很难去做好不一致性的分析，所以是全部，其他的一些增加都是为了不同的一些需要。

我们拿这些数据主要做几块，第一块是出行分析，第二是充电分析，第三块是电池分析，第四块是数据开发。任何一个单位研究能力都是有限的，而这些数据其实可以应用的不仅仅是汽车产业本身，还包括城市、交通、保险、金融、后市场，都有很多方面的应用，如何在保护隐私的条件下让大家来更好的挖掘这个应用，也是我们的一个重点。在出行里头主要包括用户行为，用户习惯，工况分析，厂商在这后面可以有各种基于BMS策略等等的研究，因为只有厂商自己本车型数据，而我们这个平台今天有大概37万5。

这两天上海发布了一个新政策，11月2号之前对非沪牌车辆的限行时长拉长了，所以电动车卖得超火，所以这些就是各种37万辆以外，这个里面65%是乘用车，但是同时还有客车、物流车，在乘用车里面包括出租车和，网约车往往是私人的购买特征，但是使用的特征却是一个商业运营，所以我们还要去做这些标签是私人但是实际是网约车的识别，这个好识别，比较难的是那些又上班又去做网约的，这些也要识别。这样就把用户的类别分得很细，纯电和插电的行为也是不一样的，纯电里头500公里的行驶里程和300公里的行驶里程和200公里行驶里程一样吗？有可能不一样，所以行为的分析和这些很有关系。

还有就是充电，在哪里充，是在居住地充为主还是公共充电桩，我们没有桩的数据，我们从车的数据，通过POI的分析可以识别出它是居住地还是公共桩，因此就可以做很多这样的设计，能不能用于充电桩的优化分布，很多研究机构拿到我们的数据在做这些研究，但是坦率来说我自己认为有点难度，就是基数不高，上海就是40万不到，每年以7万辆的速度增加，占比很高，而且变化非常大。500、600公里每年都在往上走，原来是200公里做出来的特征和现在500公里的纯电里程完全不一样，而且最后就算做出最优化，但是落不了地，充电设施关键是要落下去，如果没有空间规划来帮助落地，你说最优，哪怕说在这个网格内最优可能都找不到，找不到你想布的那个点。所以优化不是一个算法问题，还有很多其他的问题。当然充电的分析还可以在城市电网、需求侧响应有很大的作用。

电池分析，我们也做一些，但是不是我们的重点，我们如何做好一个平台，成为大家电池算法供应商。最后就是数据开放。

这是自己做的一些方法论，第一我们的数据是基于秒的，随后我们要基于这个平台把一个动力学特征的状态库做出来，也就是说不可能大家都跟我一样从底层生产作业库里面去挖数据，而且也不一定做得好，因为烂数据特别多，你把很多时间花在这里可能要占你研究时间的一半，我们就把这些做好，所以这个特征库怎么做，既有我们的认识，也要靠大家在研究过程当中给我们的要求，我们就可以把这个特征库做好。做完以后一部分是基于电化学的研究，这个研究机构也好，车企也好，电池厂也有很大的优势，这个不是单体基于电化学研究，是基于工况相关的研究。随后就是如何利用这些数据来标定它的现在的容量和不一致性，随后就得出三个结果，一个是预测，一个是现在的衰减情况，最后是不一致性，不一致性我们现在的重点倒不是为了报警，关键是大家使用的过程中不一致性可能会让你主动维护，对车企来讲可以增加主动维护的手段，使得用户满意度和车辆的寿命、事故减少，不一致性主要在这里，但是不好做。

这是我们动力学库特征的主要结构，前面是各种车辆的划分，现在我们已经有大约680个车企，大约将近100家厂家，这些这么多的车，不可能你要来研究我才给你组织数据，我们会有序把它按纯电、插电，按乘用车还是客车类别，按照材料的性质、商用、私人、车企的车型，还有电池的一些有关数据，都要把它整理好，也就是说如何组织好数据库结构，让大家非常快的去选择，这个很考验我们，我们现在没有做好，只是我们现在正在建的。第二块就是充电数据和行驶数据都是可以做的，我们要把它再做成一次一次的，每一次出行过程或者每次充电的组织，这都是基于统计意义的分析，这就是我们把这些特征用数据库做好。

当然我们要标定这个人是一个私人但是却是网约，这些都要标定出来，随后电池容量的标定大家都差不多，大多数都是利用充电过程中的那个过程来做的。最后你们去看教授们的报告，非常的多，随后再根据这些历史数据来标出现在寿命的一个动态衰减曲线，我们现在大概只能做到5%，还不太够，慢慢训练吧，因为这是一个长期过程，而且对这个车型能做出来不等于你对所有的车都能做出来，这个过程中一个车型是一根还是怎么样？我觉得还需要大家不断的去探索，才能够有比较好的结论。

最后就是不一致性，不一致性大致归为电压的不一致性，温度的不一致性，还有其他包的内阻不一致性等等，但是这些数据如何把它做好我们也在摸索，所以更当的希望大家给我们支持，或者利用我们的数据来深化这些研究工作。

最后的预测，只有把前面这些都做好，才能比较可靠的做一个预测。这辆车其实并不是很好，我们讲的不是它的结论，而是用这个数据能做出这个方法。

这些都是研究过程，对于我们中心来讲我们是要建成一个平台，这是我讲的37万辆车，基于不同组合的原始库，随后要把特征提取出来，供你们做进一步研究和算法分析用的，你是供应商你有你的算法包，每个企业都有自己很优秀的算法包，你封装好了放上来，通过一个接口任何一个用户就可以调取结论，这样它的截至就能体现出来，而且你今天的研究只是对过去那段数据的预测，但是我们的数据平台今年有数据明年还有，因此你还要去再训练，只有不断训练你的精度才能提高，甚至你可能算法本身也在修正，所以一定是平台才能做的，所以我们正在建这么一个平台。

这是清华大学毕业的一个博士现在在上海做的一个案例，他们已经做除了这么一个算法，这个算法我们今年年底准备实施上线，目标用户是后市场，当一辆车进后市场无论是买车的人还是卖车的人还是保险都关心这辆车的电池到底如何，也就是它的健康程度到底如何，要做完这个我们就通过这个算法给你一个大致的评估，目前给不到95%还是96%，那不现实的，但是优、良、中、差这一类还是可以的，因为在后市场不需要很高的精度，但是要给他类别，所以最容易实现的是后市场。让市场慢慢来评价，我们希望有多个算法，通过市场不断验证，大家慢慢接受，那个时候标准可能也就水到渠成了。

我们整个数据就是把实时工况的数据库标定好，我们自己也做特征工程和机器学习算法，主要是要理解你们的东西，否则我们都是数据工程师不做这些东西，你们和我们之间就没法交流，随后这个平台要实现这四件事，容量衰减的预警，异常状态的识别，寿命的预测和推移电池的估值，这和前面是两个概念，一个电池值多少钱，和这个电池现在什么状态，这是两个问题。后面这个问题可能在后市场和保险公司更感兴趣，在梯次利用的瞬间也有兴趣。

我们整个平台要打造这样一个数据中心，我们做完三件事，有质量保障的数据，有标签标定的数据和经过我们算法认为是可信的算法包，在这个输入端你可能是各种其他的数据商，你也可能是个算法供应商，我后面会讲到我们开放的一个应用叫“交通”，里面有很多的算法，包括拥堵等等。在座的很多是研究机构的，你今天可能是我的需求方，你来训练你的模型，你训练完了以后你认为可行了你就可以成为供应商，有后市场的应用价值，这样就形成一个很好的循环，我们做好数据、平台这个本份，剩下的我们希望大家和我们一起让数据产生价值。

大家知道这些数据是以私人为主的，上海的私人用户的占比大概要大80%左右，那么多私人用户他每天在路上开，因此对城市的交通影响价值很大，现在职住分离的研究没有中断过，在上海市保有量接近8%—10%，我们认为它开始具有研究的价值。第二，交通一旦拥堵，电动车和常用车是一样的，因此道路的评价也有价值。对于产业有什么价值，在上海的用户你们能讲得清他在一年里头在高速公路开的占比，在城市高架的占比和在地面道路的占比，或者郊区道路的占比，你们知道吗？不知道，现在谁也讲不清这个数据，这个数据干什么？大家知道电机的MAP图匹配的时候有一个最佳区，都是根据我们抽象的那个路谱来做的，实际用户如何，数据能回答你。这些都会帮助你做很多产品的设计，我们只是说帮助，不是决定作用，但是能帮助。

也就是对于用户是如何用的非常清晰，大家对于网联、无人很感兴趣，这些数据足够多了还能告诉你什么呢？在道口的停留时间，左转、右转哪个次数多，等等这一系列对你无人驾驶都有参考价值，但是还缺一点，因为原来的采集标准没有，两车之间的车头和车尾间距目前这些数据没有，但是传统车企有的，这些数据都是很有价值的，这些所有数据整合在一起将来都可以产生很多作用，我们怎么开放呢？我们把每一个用户的真正的O点和D点隐私切掉，当他出自己的原始O点开到第一个支路的十字路口开始释放，到他走到最后一个十字路口关掉，中间的都在路段中的车速，车流，这些数据是没有隐私的，所以我们要把这些数据和所有的路段整合好向大家开放，这样一来就有一个支点表，开放哪些支段我们也在探索，我们要做一些应用来告诉大家可能带来什么样的价值，这是我们认为目前最好做的，我们希望今后对电池这块也能建立我们的开放字段和数据支点表，这样大家就可以很方便使用。我们正在努力建设如何把这个做成一个数据中台，很大的挑战，我们预计一两年以后，因为是跟场景挂钩的，不是我们想当然就能做的。

最后希望有更多在座专家们给我们指导，给我们提出建议，我们有一个开放实验室，目前可以做到你可以申请入驻实验室，看到数据带不走数据带走你的分析成果。等数据中台建成大家就可以远程，不仅是要看到数据，数据隐私不会泄露，你的研究还不能被别人看到，等等一堆的问题，我们还要做很多底层处理，这个对我们是很大的挑战，我们希望能够早日实现。

我就说这些，谢谢大家。

敬请关注“2020中国汽车工程学会年会暨展览会（SAECCE 2020）”直播专题：

（注：本文根据现场速记整理，未经演讲嘉宾审阅，仅作为参考资料，请勿转载！）

SAECCE 2020 | 同济大学魏学哲：锂离子电池电化学阻抗车载获取和应用

SAECCE 2020 | 丁晓华：如何利用平台对电池实际的健康状态评价

相关推荐

北京车牌最新文章

58京牌新闻频道