AFCI 应用笔记二之数据采集

发布时间:2024-02-06  

1. 简介

本文引用地址:

基于监督学习的神经网络算法需要大量数据作为输入,模型完全由数据驱动,其数据质 量是算法有效的必要条件,所以如何高效的采集到数据,以及正确的标注或分析是极其重要的,如果第一步有问题,后续的所有工作都是徒劳。

本文将介绍 的板,以及来自 GPM China 的工具,简单分析数据质量的一些方法,以及需要注意的一些事项。

图片.png

图1. 硬件 V1.0

2. 上位机介绍

图片.png

图2. 上位机主界面

2.1. 打开串口

单击①找到相应的串口号,并通过②选择合适的波特率,点击③打开串口。注意:

1.   如果连接设备是串口+USB 虚拟串口,则需要选择正确的波特率才能正常通讯。

2.  如果连接设备是 USB 虚拟串口(比如 的开发板),则波特率可以随便选择。

2.2.

通过④设置标签,⑤设置采样率(最高 400KHz),⑥设置采样时间,⑦选择通道(目前 上位机支持四个通道),选择⑧开始数据采集。

2.2.1.     数据标注方法与原则

1. ④中设置的是文件标签,也可以理解为文件保存路径,python 脚本会根据保存的文 件路径来给数据进行打标。

2. 文件夹中必须有且仅有 “Arc”“Normal”字符串,大小写无关。其中“Arc”,表 示该文件夹下的数据全为有弧信号; “Normal”,表示该文件夹下的数据全为无弧 信号。参看下文一个比较好的数据标注的例子。

3. “Normal”信号的采集。无弧信号采集较简单,只需要关注不同的采集条件,让数 据分布更广即可。为了确保无弧,所有线头连接部分必须保证充分接触,防止接触 不良导致接头内部产生电弧,而肉眼无法看到的情况发生,拉弧机两端最好有接示 波器,电压必须为 0,以确保拉弧机接头内部没有肉眼无法看到的电弧。

4. “Arc”信号的采集。为了保证采集到的数据全部为有弧信号,需要先打开拉弧机产 生电弧,再点击⑧开始采集,待上位机采集完成,再断开拉弧机。

5. 由于拉弧与非常多的因素相关,所以数据采集应当在各个不同条件下采集。目前已 知能影响拉弧效果的因素包括且不限于:是否有关断器,是否有优化器,电流等级, 逆变器通道,硬件采集电路,拉弧距离等。在数据标注时,需要对这些情况进行相 应的标注,方便以后分析。电流等级可以以 2-3A 为一个步长采集所有电流等级内的 数据。

6. 采集时长或数据大小。没有明确规定的大小,建议每个电流等级总时长不低于 30s。 同一条件也不建议太大,因为数据量太多可能导致内存不足,无法训练或训练时间 过长。

2.2.2.     数据文件夹

1.  文件夹设置好后,采集数据,会自动在上位机同目录下生成文件夹。

2.  在 Chart 页面下,左键点击文件夹会将文件夹路径更新到④中,方便采集

2.2.3.     采集板供电

PECC 板子使用 USB 供电,可以连接笔记本,但是 USB 供电会引入工频噪声,在采集 阶段和验证阶段,必须保证环境的一致性,所以在采集和验证阶段都需要使用统一的设备进 行供电,不能切换电脑或电源。建议使用同一台电脑采集数据和验证,并且连接电源,不使 用电池。

图片.png

图3. 数据标注

图片.png

图4. 数据采集 Log

2.2.4.     采集日志

1.   Log 信息会自动保存在上位机同目录下,以当前时间作为文件名,以.log 作为结尾。

2. 如果 Log 信息中,出现了丢包或其他错误信息,最好删掉采集保存下来的这条数据。 从上文数据采集 log 中,可以看出

① :400KHz 采样率下,数据有丢包。那么,可以在 Chart 界面下,找到该条数据,点击 delete 删除。

② : 400KHz 正常的数据采集 Log。

目前,仅在 400KHz 采样率下,发现小概率有丢包情况,其他情况未发现,未来提高

USB 通信速率应该可以解决该问题,不过串口通讯仍然有误码率的可能性。

2.3. 数据分析

2.3.1.     数据显示

图片.png

图5. Chart 页面

1.点击采集到的数据①,会在右边绘制出波形图。

2.②:时域图形,横坐标表示采样点数,纵坐标表示 ADC 值。③:频域图形,横坐标表 示 N × 采样率,如果采样率为 250KHz,则 0.5 表示 125KHz,纵坐标表示幅值。

3.设置帧长⑤,拖动④可以看到不同帧长窗口下的时域和频域图形。

2.3.2.     数据对比

图片.png

图6. 上位机软件的时域和频域对比功能

1. 选择①痕迹,再选择其他数据文件,则可以对比不同数据的波形,上图为有弧和无弧 信号的对比。

2. 检查②时域部分:查看是否有异常点,是否有样本点超过最大幅值的情况,中心点是 否在 2048 附近(12 位 ADC 最大值为 4096,中心点为 2048),可以看出硬件是否 有设计问题,比如放大倍数不正确,或者中心点不正确。还可以和示波器进行对比, 看采集到的数据是否和示波器上的一致,来检查硬件或固件。

3. 检查③频域部分:查看滤波器的滤波范围是否正确,限波点是否正确,上图可以看到 数据在相对低频部分有比较好的分辨能力。

2.4. 在线识别

图片.png

图7. 识别结果

选择好①采样率和③通道,点击开始识别,就可以让开发板进入 识别模式,识别中会输出 图中④类似的 Log 信息,表示采样率已经设置为 250KHz,CH2 通道已经打开,并输出了 normal 和 arc 的百分比信息,代表是的无弧和有弧的概率。

2.5. 文件验证

文件验证功能指的是将采集到的 csv 格式的原始数据文件,下载到开发板中,进行验证, 从而判断固件部分 功能是否正常,如果固件和模型正确,输出结果应当和标记的内容一样。

图片.png

图8. 文件验证

图片.png

图9. Log 信息

图 8:在 Chart 界面下,选择需要验证的文件,双击会弹出验证对话框,点击 Yes 进行验证。 

图 9:显示的输出结果信息,以及剩余验证数据,通道信息可忽略,因为数据是从上位机下载的 和通道无关。

2.6. 通讯协议

在 Note 界面下,有相应的串口通讯协议和 Release 信息。

图片.png

图10. Note 界面

3. 总结

数据采集和标注是做好神经网络的第一步,需要格外小心和谨慎,不然其中有脏数据,通 过肉眼十分难以清理出来,脏数据过多会导致模型泛化能力很差。

其中一个办法是用模型对所有数据进行验证,然后挑选出验证结果失败的数据,然后 Plot 出来。若通过肉眼分辨,其工作量非常巨大和繁琐,还是应当在数据收集的过程中保证数据 的有效性。

更多相关信息请见: 应用笔记二之数据采集 https://share.eepw.com.cn/share/download/id/391490

文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>