Bob Neves谈论了他在可靠性测试中观察到一种现象,即现在做的测试和实际发生的情况之间存在脱节, 以及为什么如今的所谓可靠性测试,绝大部分都应该归为稳健性测试。
Nolan Johnson:组件可靠性测试领域目前有哪些最新动态?
Bob Neves:我的从业经验和关注重点主要在PCB相关的电子行业。麦可罗泰克实验室测试和评估服务的客户群,都是原材料供应商、PCB制造商以及PCB用户。说起测试,大多数购买PCB的人看待其就像看待电阻器或电容器一样——只不过是制造清单中的另一个元件而已。但实际上绝不能把PCB当作一个元件。PCB是一个非常复杂的子系统,好比是你购买的一个电源或者其他某种多元件组件,它是带有多功能性的,而不仅仅是电容器或电阻器那样只有单一属性的元件。
PCB用于在元件间传导信号,并阻隔信号传到不该出现的位置。电子组件出现问题时,通常会先排除这方面的原因——信号有没有传到正确的位置?应该有信号的位置是不是出现了信号丢失?我经历过的很多问题都和一个事实有关——PCB的互连或绝缘出现了问题。工程师找到我说:“我如果按住这个元件,可以正常工作。”或者是,“如果我用热气喷枪加热, 系统运行正常。但拿掉喷枪,就不能正常工作了。” 这种情况下很多失效最终都是和PCB有关。
元件组装完成后,有问题的都返修好并经过了测试,准备投入实际应用,这时才开始涉及可靠性。现在做的任何可靠性测试,不论测的是裸板PCB还是元件或整个组件,都需要做模拟,表明产品已经经过元件组装等一直到可以出厂的流程。不是所有人都会在测试前做这一步。很多人都是直接在收样态的元件上测试,或者在组装之前对PCB进行电气测试,说测下来“一切正常”。但是任何一种用来预测产品能使用多久的测试,都要先模拟焊接流程,然后才能测试。模拟过程还要包含返工和元件组装中的维修部分。
可靠性测试成本很高,因为首先要了解产品应用在何处,如何使用以及使用的环境。再据此想办法在合理的时间内加速产品生命周期的老化。你不可能等上10年来确定产品能用10年。你对产品的加速处理和客户实际使用产品时对它的操作之间需保持某种联系。这个过程需要大量的研究,需分离出客户操作中涉及的所有因素,以及如何在不引入或排除有可能导致失效的其他因素情况下,有控制地加速单个因素。不论这种加速是环境性的、机械性的,或是其他所有可能会出现在你产品上的怪事,重要是的是如何加速,才能使加速获得的结果可以用来直观分析“实际使用”对产品寿命的影响。
大多数人不会这样做,而是乐于做偏稳健性的这类测试。他们想要测试的条件比客户实际使用环境差,却并不了解实际使用过程中到底会发生什么,而是简单使用直接升温、降温、增加循环数或震动强度的方式,让产品运行的条件更加苛刻。其中某种加速可能和实际使用过程关联,也可能无关。我经常听到客户说:“我要做500-1000个循环。”这让我想到美旅和新秀丽上世纪七八十年代的广告,他们把本品牌的旅行箱放在大猩猩的笼子里,任凭大猩猩锤砸。如果箱子没破,说明箱子是可靠的——一个真正的稳健性测试。
遗憾的是,如今很多测试,采用的正是这种靠“大猩猩锤砸箱子”来判定稳健性的方式。他们会认为“如果大猩猩都不能毁掉产品,那客户用起来肯定没问题”。这种态度在各个阶段都出现过,通常做起来也简单便宜。大家对这种测试也有信心。如今大多数“可靠性测试”都变成了这种形式——稳健性测试(测试的和实际使用过程中的情况脱节)。这种测试简单、便宜,只需复制竞争对手的测试要求,或直接使用行业标准。但他们没有经历这个理解的过程,不清楚正在做的测试和产品实际使用时发生的情况之间到底有何关联。
Matties:用什么来做可靠性测试也是个问题吧。比如在样品上测,却和批量生产的产品上测的结果不一致?这个问题要怎么克服?
Neves:首先要假设:不管准备用什么做测试,要保证能引起产品发生变化的因素与所测试的产品相比,不会有变化。但实际上PCB很少是这种情况,因为分批次批量生产的PCB,需经过数百道流程,可能会引入各种可能的变化。
接受了这一点,可靠性测试就变成了一种生产能力测试。“我可以保证产品可靠,但我不能保证,所有的产品到达客户手上时是不是可靠的。”我会提前做好可靠性测试,然后告诉客户,“我能保证产品的可靠,后续的生产中,我会监测所有可能改变的特征,确保它们的改变不会影响已经确立的可靠性等级。”我会了解变化会对可靠性等级有什么影响。这期间我可能要标记一些高值和低值,做几次可靠性测试,然后才能了解具体情况,对客户说,“如果这种情况发生在线路板上,或者那种情况出现在元件上,抑或是焊接点遇到了某种问题,会对我的可靠性测试结果会产生哪些影响。”
Matties:客户通常会找不同的制造商负责试生产和最终的大规模生产。
Neves:在当今环境下,线路板上每个元件都会经历这种不同制造商的情况。你会和不同的制造商合作,从不同渠道购买材料,所以也会有相关的可信源问题,且要确保产品不能是次等货或复制品。你得考虑加工过程中或者是更换元件供应商时遇到的常规偏差。你要监控各种各样的问题,这样才能确保一开始为了保证产品在实际使用过程中足够可靠而进行的大型长期测试的结果不会发生改变。
Neves:从变量来看,元件越复杂,就越有可能失效。和制造PCB所需的众多流程相比,像电阻器或电容器,完成一个成品通常需要不到50个流程,失效的几率就要小很多。对于制造商而言,这种元件只要有良好的质量控制系统,就可确保产品能够重复制造。
而变压器、PCB或其他子组件则需要经历数百个环节,交互作用又非常复杂,制造商也没法完全说清。互相依附的流程中本身就会引入偏差,最终会导致产品在实际使用过程中的可靠性受到影响。
Johnson:你刚才提到准备测试时要进行“焊接模拟”。那什么是焊接模拟呢?
Neves:过去元件主要都放置在孔里,我们常常做浸焊测试。用一个附连板代表PCB,将其浸入焊料桶中,给附连板传递同样的热量,就像在波峰焊接操作中见到的那样。如今,大多数使用空气对流回流焊组装,维修时用手工焊接,也有其他添加零件的流程不能使用空气回流焊操作。在实际使用过程中,至少在PCB领域,有很多测试需要让线路板经历一个模拟回流焊的过程。模拟过程中,会使线路板表面尽可能多达到最坏情况下板子带元件承受的温度,并持续成品能承受的最长暴露时间。但很多时候你可能在回流焊线路板之后又返工或维修。模拟元件安装流程通常包含4-6次暴露在严苛环境下的回流焊,这种情况在业内很常见。了解了成品板在回流焊时可能遭受的最严重损坏,就可以在可靠性测试前,在回流焊预处理中模拟同样程度的损坏,给附连板施加同样的应力。
这种方法不仅适用于解决互连问题和绝缘问题,同样也适用于高频测试,因为材料经历过元件安装流程后,其电气性能会发生一些变化。为应对无铅流程,现在大多数材料的玻璃化温度(Tg)都较高。但这些材料并不是同质的,而是由不同的树脂和添加剂混合而成。即使一个材料的额定玻璃化温度是180℃,它也不是单一的额定玻璃化温度180℃的树脂构成的,那样材料会很脆,容易碎裂,同时还会有其他各种问题。把玻璃化温度130℃-140℃,或者160℃的树脂混合到树脂群中后,构成了高玻璃化温度的树脂基体。元件安装时的高温,特别是无铅工艺使用的温度,会严重影响树脂基体中低玻璃化温度的树脂,导致PCB材料的介电常数(Dk)和损耗因数((Df))发生改变。反复暴露到高温环境当中也会改变树脂基体。当树脂基体开始瓦解时,Dk和Df以及阻抗大小都会改变。
对于高频产品而言,很有必要在做最终的高频测试之前让材料暴露在今后会接触的高温环境下,因为元件安装导致的PCB层压板树脂体系的改变可能会影响结果。焊点本身的形成是一种非常复杂的过程:在线路板表面和元件表面形成连接,防氧化的同时,在不同材料和表面涂层之间形成金属间化合物。整个过程中有很多环节都可能失效。从有铅材料到无铅加工,无铅焊料的实际机械性能并没有含铅焊料的包容性强。市面上有各种不同的无铅混合焊料,每种成分添加1%-2%,以改善焊料的晶体结构,避免太多导致实际使用时失效的应力。
Johnson:对我这种有软件从业背景的人而言,我很好奇这类测试的建模过程是什么样的。像是一个物理实验室的实验。
Neves:没错。我们实验室有台13温区的水冷回流焊炉,我们用它来组装线路板、附连板和其他东西。还有一台HATS2测试仪,可以在线路板的附连板上进行回流焊模拟,同时记录整个过程中的电气测量值。附连板处于回流焊温度下时,可以查看导通孔的电阻,看它在高温情况下是否会发生分离。很多时候,材料冷却后缩小到正常尺寸后,又形成看起来似乎很稳固的电气连接了。
如果导通孔或微导通孔因为高温下材料膨胀产生的应力而分离,你就能实际看到高温下电气上的分离。随着PCB在冷却时又缩小到正常尺寸,你得到了一个看上去可以形成稳定电气连接的机械连接,而且可能在较低温度下测试时,再也看不到这种分离。只有在回流焊温度最高的时候才有可能再次发生,此时极度膨胀导致了导通孔物理上的分离。当回流焊监测测试逐渐成为PCB的要求,人们想做这种“电气监测”的回流焊模拟测试,会在PCB上看到更多这种情况。回流焊模拟过程中会进行电气测试,然后再进行某种热冲击测试来确保获得的某种循环能代表实际使用寿命的加速。
标签:
#质量与可靠性
#稳健性
#测试与检验