作者联系方式:E_mail: china@rdcoo.com QQ:237681844 http://www.rdcoo.com
产品的可靠性设计方法,从表面上看都是技术问题,但实质上包含技术和管理两个方面,没有技术不行,有了技术,如何把技术贯彻到位也会有好多细节该注意。所以本文的可靠性提升方法中也包含进去一些设计管理方法的内容。
中小企业提升产品可靠性的几大难题,经过笔者多年来和各类企业的多位技术管理者的交流,不外乎几个问题: 1可靠性概念太复杂,又是概率又是英文简写的专业词汇,不知道和我的产品有什么直接的联系,不知道这些技术指标如何用于评价产品的可靠性程度;
2可靠性试验一般要求较多的样本数量,公司规模较不大,生产的是专业化设备,批量很小,小批量设备下如何开展可靠性试验摸不着头绪;
3公司每年的营业额不过几百万几千万,没有那么多的资金用于可靠性试验费用和设备的购置;
4公司想提升产品可靠性,也想配备专业技术人员,但这方面技术人员难招到,即使招到大都是外企的背景,要价较高,干了一年多也没什么成效;
5以上措施都不好使时,那就寄希望于设计人员个人的技术水平比较高,设计出的东西能耐用,但是一台机器不能只靠一个人完成,就像木桶盛水多少取决于最短的那块木板一样,机器的整体水平往往在最薄弱的环节暴露故障,我们也不可能保证每个项目的设计者都是梦之队成员。
6请专家帮助,如大学、科研院所、华为、中兴等大的机构的人员来进行指导,最后的结果往往不了了之,似乎是在听天书,专家说的全对,就是没办法实施,对中小企业这也是现状,也让人困惑无从下手。
以上这些问题,有些是我们中小企业管理者的错误认识,有些是我们的企业现状的无奈,还有就是国家整个的产业技术环境造成的,我们不必怨天尤人,在迷茫中立足于企业现实开始我们的产品可靠性提升之旅。
产品可靠性问题出现的原因分为两个,一个是设计的可靠性(也称固有可靠性)是否好;一个是固有可靠性在生产使用中是否能得到技术管理保障。现在大多数学者的可靠性研究集中在可靠性保障方面,中小企业技术管理者的几点困惑就是这种现象导致的,可靠性保障似乎成了可靠性的全部,但中小企业的现实是产品的固有可靠性设计的就很不好,后面再怎么保障能使可靠性维持在较高水平呢?设计是产品可靠性的基础,对军工企业、大企业,他们的设计可靠性是可以保证的,然后再讲可靠性试验、预计、保障是对的,但中小企业产品的设计可靠性就不好,就该把重心放在产品可靠性设计的技术方法和设计控制管理上才对。以下的方法就是基于这个基本思路展开。
1基于产品故障的失效分析和失效预防
产生上面几条感慨的企业一般都有几年的时间了,对于这种企业,其实掌握着一个宝藏,对这个宝藏妥善利用了,产品的可靠性将有非常明显的提升。这个宝藏就是过去几年的投诉记录和质量分析记录。对这些记录统计,组织分析原因,实验确认这些原因确实是导致失效的因素,然后研究出预防措施,余下的就是在公司运营中确保预防措施被执行了。做到了这几点,产品的可靠性提升将是显而易见的。这个分析和试验的过程会涉及一些较高难的技术方法,但依常规80%以上的问题会很容易就被解决的。
以笔者经历的一个案例来说明,一个液体流量阀,里面有一个靠弹簧顶住的截流板,偶尔有客户投诉我们的产品未开机就漏液,原来在研发实验室的时候,没有发生过这问题,技术人员也没太重视,此时就一直拖下去了,后来公司加了项考核指标“投诉问题解决率”(解决的问题数占总投诉比例数的百分数),研发才真正重视起来,开会分析原因(如下图,图贴不上去,www.rdcoo.com的技术文丛栏目"paper3"**可以查询)。然后一项项试验,液体源实验也不用太复杂,塑料桶开个孔,把桶里水的液面抬高,出水管口的管压增大看阀是否漏水,发现不加压就漏,加压漏得更厉害;把截流板拆到另一个阀上试验配合是否紧密,确认了配合没有问题;最后确认换成原来研发用的弹簧,发现不漏液,换回来就又漏;初步确认为弹簧问题,检查弹簧在挂上相同重量的物体后,形变有差异,研发用的弹簧形变小。多次几个不同弹簧验证,确认失效原因是弹簧在多次使用后弹性系数发生变化,而设计图纸上又没有关于这项指标的检验方法,因为没有检测弹簧的工具,并且形变是发生在使用一段时间之后在公司也不好入检。于是找采购人员查厂家的信息,发现研发样件的厂家和批量生产厂家不是同一家,所以就在外购件规格书上对供货厂商进行了指定,制定研发样件的厂家为供应商,并封样,要求厂家按照封样的弹簧的材料、规格和强度等指标供货,公司舍不得买台弹簧拉压测试仪,就通过非技术手段解决,不过后来此类问题也没再发生过。
从这个事例看出,很多问题的分析其实也并不是很复杂,解决问题的预防措施也未必就是改动设计。只要我们肯静下心来,静心分析,解决也并不难。液压变化的实验装置也是大家集思广益的结果。
通过这种方法,有了价值50元钱的电快速脉冲群测试仪、有了价值200元的辐射抗扰度测试仪、有了价值300元的盐雾试验箱,有了我们产品的常见失效模式,然后有了针对性措施,产品可靠性有了明显增长。
这个方法的执行要素有几点:有故障数据和现象记录;有技术分析会议;针对分析的实验;针对试验结论的分析结论;针对结论的预防措施和实施到位。有人说,这么简单,但事实上就是这样简单的事情没做好,最常见问题的两个地方是:针对分析的实验方面不具体;针对试验结论草率下结论。这都是人存在的弱点,不是技术的难度。
总结到一点:针对故障投诉作失效分析,得出失效机理,针对失效机理制定实施预防措施。
2加强系统设计技术和系统设计管理
走访很多公司没有系统设计部门,有的有系统设计人员,但干的事研究的问题不够系统。最常见的模式是一个资深的技术人员当项目经理,带着几个小毛头搞设计,几个这样的项目队伍对一个技术部经理汇报。然后产品出现投诉了,经理的常见解释就是“招水平高的招不到,都怪这帮工程师水平差,就这样还老闹着加薪跳槽”。这些人里头也不是没有几个高手,但都是项目经理,也要承担具体的设计。木桶盛多少水取决于最短的那块木板,项目经理能干也没用,产品该出毛病还是出毛病。这个现象的解决方法就是加强系统设计的管理,对系统设计人员要学点系统设计知识。
系统设计管理方法也很简单,设置系统设计岗位或部门,让设计水平较高、知识面较宽的人才到这个职位来,如果公司规模较小,就让这个岗位负责系统设计和设计审核,如果研发规模够大,就系统设计和设计审核岗位分开,但一定注意,必须把资深的高人放在这两个岗位上。这样,所有设计人员的设计细节都要被高人审核,不合格则退,最后出去的设计成果基本上就符合了审核人的水平,这样,最短的那块木板就补上来了,原有的人员结构也未发生变化。审核人员和系统设计人员属于同一个团队,系统设计的思路一定要贯彻到审核人员的脑中,审核中确保设计系结执行了系统设计要求。比如系统设计要求工作温度满足-40℃,那审核时器件的温度规格必须都得满足此要求。这是一个管理组织架构上的要求,没有这个审核机制的保证,系统设计思路很难贯彻实施好。
第二是系统设计方法的问题,这是要系统设计人员掌握的,太多的中小企业,系统设计几乎是缺位的,即使较牛的一些项目经理似乎被冠以系统设计师的title,但没能落到实处,常犯的错误理解就是: 系统设计=法规标准设计要求+客户功能需求;
这是很不全面的,仅按照这两种因素设计,就忽视了很多其他的技术要求,并且往往就这两个要求也大都理解得不全面。下面举一些与可靠性设计有关的系统设计知识点,如产品系列规划、目标功能和用户定位、工程计算、历史失效数据分析、法规标准、知识产权、器件选型、生产检验运输过程、安装交付、极限环境条件、可用性、可维修性、模块接地与系统接地、热设计、EMC、震动噪声、盐雾、接口等,这些都是和系统设计有关的技术内容。有人会说“要把你这些要求都做了,那得多少技术人员啊?”,答案是1个,规模小点的企业一个都不用,别被这么多的系统设计要求给吓住,其实每一细项里,常规的技术要求和技术点也就那么几项,非常少的,这几点都不必单独设计,只要在选择设计方案时按照技术点去选,系统设计就被执行了,后面的诸多问题就迎刃而解了。比如电磁兼容EMC,最复杂的一个技术要求,在标准测试上的考察项目是4个EMI指标(RE、CE、Harmonics、Flicker)和7个EMS指标(RS、CS、ESD、EFT/B、DIP/i、PMS、Surge),它的要求主要集中在面膜、机壳的密封接缝方法、机壳材料、机壳开孔的处理、机壳对外的电缆处理、电源模块几个关键地方,在系统设计时面膜的安装方式、面膜的设计上选择防静电处理方式或在面膜后面加块接机壳地的金属背板,金属板上的电接头选择带滤波的插座,这种方式一下就能改善EMC的ESD、RE、CE、RS、CS等几个隐患;再比如模块接地与系统接地的考虑,先画出系统接地图,这样整机的电气安全、接地阻抗、对地漏电流等指标的关键薄弱点就一目了然了,也能估计出板间信号可能造成问题的隐患薄弱环节,哪些地方形成了地环路,哪些地方形成了天线效应,通过系统设计时的地线图就能在整体上解决后面的一系列问题。
系统设计是综合各方面的知识,综合权衡,得出最优的解决方案,是在不同技术间的平衡,比如对一个采集的信号要进行滤波处理,是采用电路硬件滤波器还是AD后用数字滤波器?对驱动力矩要求较大时,是选大扭矩电机还是增加机械减速器?防盐雾侵蚀是用防锈材料还是涂三防漆还是加强密封?在这些不同技术间平衡的时候,综合的是成本、工期、团队成员对技术掌握的程度、法规、安全、批量供货时加工商的批次稳定性的保障能力等。
往简单里说,系统设计方法就是把一些外围的技术要求全部涵盖进产品开发里来,用checklist的方式进行检查,而不是先出整机,然后再改,那样机器将不是机器了。国内诸多做产品CE认证的中小厂家,试问有几家把产品真正卖到了欧盟国家,不敢啊,在公司里都有三种机型的说法,分别叫在产机器、CE样机、CE状态的机器,大多中小企业的产品是前两种,为什么出现这种局面?就是没有系统设计,先出整机,然后再改,最后拿个CE证当虎皮唬人去,就是不敢上景阳岗怕遇到真老虎。
系统设计其实真得不难,有这么类岗位,能作系统设计+审核,再加上点提炼的checklist,基本就可以开工了,剩下的就是系统设计师找到感觉,加强自己的技能训练,让系统设计真正发挥作用了。实在不行,请这方面的专家帮助实施一下也是可以的,辅导上1-2个项目,建立一套体系,将无往而不胜。
3建立技术平台,建立可靠性保证流程
百年老店的大公司的产品为什么都比较好呢?他们的技术人员就比我们的资深吗?他们不也都是年轻人吗?百年老店的核心价值除了品牌还有什么?还有他们在专项技术上的积累。也就是说100年的技术经验和教训今天仍然被引用参考,它拿出一百年的积累和我们竞争,这是我们不可能具备的东西,很多事情必须经历过才会发生,发生了解决了才会成为积累。百年老店如何积累下这些东西的,它靠的是什么来传承这些精华?答案是技术平台。再往通俗里说,技术平台的表现形式就是一堆的专业checklist文件,这些检查项是多少代人的深刻总结,到了今天,一个工程师都不必经历什么,他就能得到前人的教训经验,并用于设计中,自然可以避免很多问题。
我在工作中曾经做过标准法规的checklist、EMC设计的checklist、系统设计的checklist、可用性的checklist、研发控制体系的checklist等等,这些都是很低成本就能实现的东西,但它又有很高的成本,它是一份总结,是汇集了多少代人心血的总结。 抽取几个出来,如 “少用分立元件,多用集成电路”、 “不定制器件”、F2W分析方法、 “经常要用到的控制器的高度应该在人的肘弯和肩膀之间”、 “显示界面不要出现同一变量的不同信息”、 “在正常使用时设备倾斜100不会失去平衡”、 “不提供热量的应用部件表面温度不得超过410” “显示部分高度应位于操作者在操作姿态(考虑站姿和坐姿),距离1米情况下,其水平视角上斜150至下斜450范围”等。
这些都是多少代人、多少个不同专业的人呕心沥血的结晶,如果一个公司建立了一个属于自己、适用于自己的一个技术平台,并在设计管理中认真执行它,通过审核控制和测评控制它的实施效果,那么公司工程师的水平将飞速提升,即使是很一般的工程和能做出很出色的产品来。
4研究可靠性设计方法
作为技术人员,最喜欢的就是技术了,在公司和管理层面把架构搭好了之后,作为技术工程师和系统设计师,可靠性的知识和设计方法就是需要补课的了。可靠性设计方法包括很多方面的内容(有些和系统设计的内容重叠,这不矛盾,系统设计研究的是整体,设计方法是把系统要求具体实现的方法),气候环境防护设计、热设计、EMC/EMI设计、降额设计、裕度设计和稳定性设计、冗余设计、缓冲减震设计、元器件选型、可使用性设计、视觉显示、照明、控制、控制面板布局、控制与显示器关系、安全性设计方法、防电力危害、防机测危害、防辐射危害、防止火灾危害、可维修性设计方法、测试与调整方法、标识、可接近性和可更换性、插头和插座、紧固件、轴承、报警、印制电路板设计方法、可靠性试验验证方法、可靠性测试工具等方面的知识和内容。
关于每一个技术主题的细节不是本文区区几千字就能写得明白的,其实所谓的设计方法就是一些设计规范和考虑问题的知识点。为了方便,也可以做成checklist,让技术人员在设计初期学习参考,在设计过程中对照,在设计结束时自查,在提交评审是由测评机构或审核岗位对照checklist复查和针对一些关键设计规范做实验验证。
以降额设计为例来阐述一些具体的设计方法: 比如对失效率高、重要部件及器件一定要进行降额设计。 1、电阻器降额外加功率、极限电压、极限应用温度三个指标,功率降额系数0.1—0.5; 2、电容器降额外加电压、频率范围、温度极限三个指标,普通铝电解电容和无极性电容的电压降额系数0.3—0.7之间,钽电容的电压降额系数0.3以下; 3、集成电路降额结温、输出负载指标; 4、晶体三极管降额结温、集电极电流、任何电压指标,晶体二极管降额结温、正向电流及峰值、反向电压三个指标,功率降额0.4以下,反向耐压0.5以下,发光管电压降额0.6以下,功率降额0.6以下,功率开关管电压降额系数在0.6以下,电流降额系数在0.5以下; 5、线圈扼流圈降额工作电源、电压指标; 6、变压器降额工作电流、电压、温升(按绝缘等级)指标,电感和变压器的电流降额系数0.6以下; 7、继电器降额接点电流、温升(按绝缘等级)指标; 8、接插件降额电流、电压指标,根据触点间隙大小、直流及交流要求降额。接插件嵌入材料和火花发热对接点寿命的影响,在中低频多接点接插件采用两点或多点接地并联方式,降额和增加冗余功能; 9、电缆导线降额指标:电流(铜线,≤7A/mm2)、电缆电压(尤其多芯电缆),塑料导线的电流降额0.7以下 10、开关器件降额指标:开关功率、接点电流 11、电动机降额轴承负载、绕阻功率指标,伺服电机的轴承失效和绕组失效,轴承负载降额和绕组功率降额0.3—0.8; 12、结构件降额指标:增加负载系数、安全余量 13、对电子元器件降额系数应随温度的增加而进一步降低。
对有些指标是不能降额的: 1、继电器的线包电流不能降额,而应保持在额定值左右(100±5% );否则会影响继电器的可靠吸合。 2、电阻器降低到10%以下对可靠性提高已经没有效果。 3、对电容器降额应注意,对某些电容器降额水平太大,常引起低电平失效,交流应用要比直流应用降额幅度要大,随着频率增加降额幅度要随之增加。 4、结构件设计降额不能增加过大,否则造成设备体积、重量、经费的增加。
作为设计师,只要把这些设计规范设计进了产品中,产品的可靠性一定会提升的。这样的设计方法,有多个获取的渠道,一是内部交流脑力激荡汇总起来;二是和专家交流,找专业的研究院所、咨询机构、专家个人通过请教的方式汇总起来;三是向供应商学习,机加件供应商与设备厂家相比一定算是工艺加工的专家,芯片的提供厂家在芯片检测应用方面一定是专家,线缆的加工商在线缆技术上一定是专家,通过向这些专家的学习,也能有不少收益。
可靠性设计方法的研究是长期积累的过程,不要奢望一蹴而就,毕竟十年树木,百年树人,方法不但要有,还要被技术团队消化掉,这自然不能朝起则夕闻道那么快了。
5加强可靠性管理措施,保证设计的固有可靠性
无论是可靠性设计过程还是可靠性保障过程,为达到设计规范的被贯彻,都需要一些管理手段来保证,不然再好的技术也发挥不了作用。这就是可靠性管理和评价措施。
可靠性管理好一定要先有个评价指标,没有指标就没有效果好坏的检查和对比,设计者就没了方向。但这个指标如何定?在过去人们是有误区的。MTBF、MTTB这些指标固然重要,但那是对大企业、对可靠性预计、对大批量有足够样本数统计的产品的评价指标。对中小企业,不必要太研究高深的可靠性预计理论,MTBF没必要,对几千万的企业,甚至ppm(Part Per Million)、fit(Failure In Time)都不必过多研究,而是立足于现实,把质量管理的一些技术指标引入作为可靠性指标即可。如单板的年返修率、电路板加工的一次直通率、设计规范引用率、新机器失效问题预防率等。有了设计指标,统计实施可靠性设计管理之前的量化指标,再有实施后的量化指标,一对比,努力的成果就能摆到桌面上来,只要我们是在一点点进步的,那就很值得欣慰。
除了设计阶段的考量指标,投产后各环节的管理和指标设定也是必不可少的,如供应商的选择、供应商的认证和评价、物料选型方法、生产现场ESD/MSD防护方法、物料储存方法、电气组装机械组装过程的可靠性保障、制造过程的失效分析都会制约产品可靠性的提升,这些虽然也有可靠性技术的成分,但大都属于可靠性保障的内容,不在本章节的讨论范围之内了,另见相关**。
6总结
本文的思想基础是产品通过设计实现其固有可靠性,通过保障管理实现其制造过程不降低固有可靠性。
本文在上面思想下讲述了中小企业机电产品的可靠性设计技术和技术管理方法,包括了基于失效机理的实验分析和预防、加强系统设计技术和系统设计管理、建立以技术平台为基础的可靠性设计保证流程、学习具体的可靠性设计方法、设定量化的可靠性设计考量指标并通过管理措施保证产品的高设计可靠性五方面的内容。每个细节内容和方法又都有自己的诸多技术成果作为支撑,设计与管理思想、设计与管理工具、具体的设计知识三部分构成了产品高可靠性的保证基石。
相关链接:http://www.rdcoo.com |