精益取舍:维持现状换取更优周期时间

为缩短晶圆厂周期时间需改变的习惯

Engineer computer fab with charts.jpg

作者:詹妮弗·罗宾逊

大多数晶圆厂的目标是实现低且可预测的周期时间。虽然工厂内部存在结构性因素(如产品组合复杂、流程重复性、时间限制)导致难以达成目标,但工厂团队的某些决策也会推高周期时间。根据我的经验,晶圆厂通常会为三件事牺牲更优的周期时间:降低成本/提高收益、提升良率,以及我们称之为现状(即对变革的抵触)。

我们在第26.04期探讨了成本与周期时间的选择,在第26.05期探讨了周期时间与良率的选择。本文将讨论第三类选择:晶圆厂可实施的、有望缩短周期时间的变革措施,但这些措施需要克服强大的惯性阻力。这种变革阻力的迹象体现在诸如以下言论中:

  • “但我们一直都是这么做的。”
  • “没有理由在今天做出那个改变。”
  • “这是管理层想要的。我们能怎么办?”
打破5个习惯以缩短晶圆厂周期时间
5 habits to break to improve CT
打破5个习惯以缩短晶圆厂周期时间

第26.01期《为何及如何提升晶圆厂周期时间》中,我提出了一个三步流程(如下所示)来改善晶圆厂周期时间。在掌握基础知识并收集数据后,我强调了晶圆厂团队采取行动的必要性。(您可参阅本月订阅者讨论论坛了解潜在的第四步。) 事实上,无论是晶圆厂还是生活中,明知变革有益却选择不行动的情况并不少见。或者至少,选择暂不行动。下面我们分享一些来自晶圆厂的具体案例,希望这些案例能促使某些晶圆厂重新审视现状。

晶圆厂周期时间改进的三步流程包括了解基本原理、收集数据和采取行动。
缩短生产周期分为三个步骤
晶圆厂周期时间改进的三步流程包括了解基本原理、收集数据和采取行动。

提升晶圆厂周期时间需摒弃的五大惯性思维

在任何一天,最简单的方式就是沿用昨日的做法。下文我们将探讨五项操作实践——改变这些做法有望缩短晶圆厂的周期时间。我们将分析维持现状可能带来的后果,并提出减轻这些影响的解决方案。

当然,并非所有晶圆厂都会做这些事情。但我认为大多数读者至少会对其中几项感到熟悉。这些都是我多年来从晶圆厂从业者那里听闻的行为。

1. 团队项目管理及其他不可用时段: 当某项工具停机时,维护团队往往会自然而然地提出:“既然这个工具已经停用了,我们不妨趁机处理其他必要的维护工作。”

  • 可能结果: 批量处理维护任务(PMs)在减少工具所需的资格认证时间以及优化维护团队时间分配方面可能较为高效。然而,这种做法通常会显著延长周期时间,尤其对单件定制工具而言。问题在于较长的不可用时间会导致在制品积压,进而延长队列等待时间。详见第22.01期专题:《关于拆分计划维护及其他不可用时段的探讨》。
  • 为说明这种行为模式,请参考下图所示的运行曲线。所有情况下,某台独一无二的设备均有20%的时间处于不可用状态。蓝色曲线显示该设备平均每8小时停机1.6小时(占20%);绿色曲线显示该设备平均每24小时停机4.8小时(仍占20%)。红色曲线中,工具每72小时停机一次,每次持续14.4小时(停机率仍为20%)。可见红色曲线的X因子约为蓝色曲线的两倍。即使蓝色曲线因额外进行资质认证导致利用率略高,其表现仍远优于红色曲线。若询问经验丰富的制造团队成员更倾向于短暂频繁的中断还是长时间间隔的中断,他们几乎都会选择前者。这是因为他们深切体会过因长时间停机事件导致的工厂中断所带来的痛苦。
在相同故障率下,不同平均维修时间对应的周期时间运行曲线。维修时间越长,周期时间越高。
FabTime Operating Curves under different MTTR
在相同故障率下,不同平均维修时间对应的周期时间运行曲线。维修时间越长,周期时间越高。
  • 您可采取的措施: 避免此类行为的最佳方式是,将故障间平均时间(MTBF)的追踪转向维修间平均时间(MTTR)或绿灯到绿灯时间的追踪。(绿到绿时间指工具首次不可用至再次可用间的总耗时,即使期间记录了多次计划内/外停机事件。详见第25.04期或第20.02期说明)。在持续监控整体可用性的同时,保持平均不可用时间较低,有助于将周期时间控制在合理范围内。由于这种动态关系往往违背多数人的直觉,周期时间培训在此领域尤为有益。更多信息请参阅我们的周期时间课程

2. 让操作员偏好催生专属工具: 在允许操作员在一定程度上自主选择在何种设备上运行何种批次的工厂中,我们有时会观察到操作员对特定设备的偏好。这种现象被称为“软专用”。例如当某工具组内设备位置不便,或操作员更青睐新型设备而非旧款时(当然也可能出现操作员偏好旧设备的情况),这种现象便可能出现。

  • 可能结果: 软性投入将导致部分设备利用率下降,而另一些设备利用率上升。这种情况通常与晶圆厂产能规划系统预期的情况不符。利用率高于预期的设备将拥有较少的缓冲余量来应对波动,因此其周期时间将延长。
  • 下图展示了工具的周期时间与利用率之间的关系,以及待机时间如何使工具远离曲线的陡峭部分。软专用化减少了操作员偏好工具的待机时间,从而提高了每次访问的周期时间。这种增长呈非线性趋势,因此当发生在利用率本就较高的工具上时尤为突出。对于存在显著冗余产能的工具组,软专用化问题则相对较轻。
Operating curve image showing how standby time provides a buffer
Operating curve image showing how standby time provides a buffer
当待机时间接近零,利用率接近100%,周期时间变得不可接受地高时。
  • 可采取的措施:实施调度系统并强制执行排程要求,将有效降低软性资源占用率。高度自动化且采用排程管理的工厂通常不会出现此类问题。
  • 对于操作员拥有更大自主权的工厂,我们建议检查是否存在因软性专用导致单次访问周期时间过长的设备组。具体方法是:调查单次访问周期时间较长的设备组,并比较每台设备的移动次数与可用效率。重点排查设备匹配异常情况——即某台或多台设备的移动率低于可用性预测值。当设备组内部分设备出现高待机/在制品等待时间而其他设备正常时,也可能表明存在软专用现象:因在制品需等待优先设备空闲,导致非优先设备长期闲置。

在下面的FabTime演示服务器示例中,左侧图表显示开发人员#1的移动量低于预期(黑色曲线),相较于其他工具。右侧图表则显示开发人员#1的待命-在制品-等待时间高于预期。

FabTime演示服务器上的软性奉献示例,显示开发者#1的移动次数低于预期。
SoftDedicationExampleFabTime
FabTime演示服务器上的软性奉献示例,显示开发者#1的移动次数低于预期。
  • 若发现软专属配置导致每次访问的周期时间延长,则有必要在相关区域加强调度合规性管理。通过结合教育(说明为何需要保持工具组内所有工具的利用率趋于一致)与数据(展示特定区域因软专属配置导致周期时间增加的情况),可有效推动改进。

3. 暂停使用停工设备: 当某台设备预计将长期停用时,部分晶圆厂会暂停使用该设备所需的批次。此举旨在告知操作员,当前无需对这些批次进行任何操作。

  • 可能结果: 因设备停机而暂停批次生产存在两大问题。首先,停机时间对批次周转周期的影响被掩盖,这使得维护技术人员难以判断哪些设备应优先维修,也使后续设备改进项目或备件合同的合理性更难论证。其次,工厂可能缺乏自动解除批次挂起的系统机制,导致设备恢复运行后批次仍处于挂起状态,从而不必要地延长批次周期时间。
  • 您可采取的措施: 最佳做法是避免此类操作。我们建议当暂停原因掩盖了样品延迟的真实原因时,不要设置样品暂停状态。若必须执行此操作,请务必使用可供后续分析的具体暂停代码(例如"因工具故障暂停")。代码描述越详细越好。当工具恢复可用时,建立自动解除批次暂存的流程同样至关重要。至少需确保每班次审查暂存批次清单,以识别可能被遗漏的批次。即便采取这些预防措施,您仍将面临无法查看每个停机工具对应在制品队列数量的问题。

4. 换班期间工具闲置: 许多工厂根据每班次完成的操作次数评估操作员绩效。在这种情况下,操作员往往缺乏动力去处理那些无法在班次结束前完成的批次。

  • 可能结果: 若操作员在班次结束前让设备闲置且在制品等待,工厂将损失这些设备的产能。这种产能损失会在设备性能图表中体现为待机-在制品-等待时间。待机-在制品-等待时间会使设备在运行曲线上向更陡峭的位置偏移,从而推高周期时间。详见第25.05期
  • 在观察动态X因子(DXF)的每小时趋势时,有时可观察到这种现象。DXF在每个时间点显示晶圆厂的总在制品(WIP)除以当前在设备上运行的非返工在制品。在换班期间让设备闲置的工厂会出现DXF值的突增。虽然整体在制品总量每小时变化不大,但设备上运行的在制品可能急剧减少,从而导致DXF值飙升。下图展示了某真实工厂的案例:该工厂的每小时DXF值通常在3至4之间波动,但在每12小时的换班时段会出现超过50%的突增。
动态X因子图表,每周每小时测量一次,显示晶圆厂换班效应
DXFwithShiftChangeEffect
动态X因子图表,每周每小时测量一次,显示晶圆厂换班效应

您可以采取以下措施: 有几种方法可以减轻这种轮班变化的影响。您可以:

  • 实现一个调度程序,并根据调度遵守情况而非移动次数来衡量操作员的绩效。
  • 错开换班时间,避免每个区域的操作员同时离开工厂。若操作员接受过充分的交叉培训,此举将减轻设备闲置的影响。
  • 补充工序采用不同考核指标,即使工序无法在班次结束前完成,仍会奖励已启动的工序批次。FabTime早在2013年应客户要求就实施了类似指标,称为"已完成计划工时"。详情请参阅第14.01期《克服班次交接期间的生产力损失》。
  • 将追踪和最小化工具待机-在制品-等待时间纳入您的制造文化。

这些观点归根结底是说,除非你的考核指标和轮班安排与这种行为相匹配,否则要求操作员在换班期间保持设备运行是不合理的。

5. 将周期时间排除在晶圆厂指标之外: 历史上,晶圆厂专注于吞吐量和良率,因为这些是盈利能力的关键驱动因素。这导致了移动次数、出货量和废品率等指标的盛行,而缺乏关注周期时间的指标。

  • 可能结果:正如换班期间的闲置时间所示,若未对员工的周期时间绩效进行考核,便无法期待他们做出推动周期时间优化的行为改变。同样地,若缺乏能指引当下行动方向的指标来提升未来周期时间绩效,企业将难以明确应采取哪些具体措施。
  • 您可采取的措施: 为缩短周期时间,建立涵盖周期时间和/或在制品数量的指标体系具有现实意义,这些指标能指导我们采取哪些改进措施以提升未来绩效。

这些指标反映了过去的周期时间表现:

  • 出货批次的制造周期时间、X因子及每层掩模所需天数。这些均为标准指标,在跨晶圆厂比较及整体晶圆厂绩效基准测试中具有参考价值。由于晶圆厂工艺流程通常较长,这些指标在识别改进机会方面作用有限。

这些指标有助于识别当前周期时间的瓶颈:

  • X因子(即队列时间)按工具组划分,统计过去一两天内完成的操作。每次访问队列时间较长的工具组是启动改进工作的理想切入点。在下图示例中,所有标注为红色的工具组均属于需重点关注的短期周期时间瓶颈。
过去两天的周期时间瓶颈,来自FabTime演示服务器的示例
CycleTimeBottlenecksPast2Days
过去两天的周期时间瓶颈,来自FabTime演示服务器的示例
  • 在制品工时。这是FabTime用户社区开发的新指标,用于识别周期时间瓶颈。该指标在按工具组追踪在制品的基础上,进一步计算队列中在制品所需的预计处理工时。详见第20.03期关于在制品小时数的详细说明,以及第21.01、21.03和21.04期关于短期与周期时间瓶颈的深入讨论。

这些指标可对周期时间进行前瞻性评估:

  • 动态X因子,如上所述。当DXF按小时测量并随时间求平均值时,其等同于出货批次X因子。若该值开始上浮,则表明(若情况持续)未来出货批次周期时间将延长。有关DXF的更多信息,请参阅第9.04和15.05条。
  • 在制品周转率与动态周期时间。在制品周转率(每日移动次数除以平均在制品量)可反映晶圆厂的生产节奏。若周转率下降,则预示未来周期时间将延长。FabTime中的动态周期时间指标通过计算每批次所需工序步骤数,将该生产节奏转化为以天为单位的未来周期时间预估值。详见第24.03期:前瞻性周期时间指标。

引入这些以周期时间为核心的指标,有助于您的晶圆厂识别短期与长期的改进机会,并激励团队成员实施必要的变革。

结论

权衡取舍存在于生活的方方面面,在晶圆厂的复杂环境中更是如此。周期时间与成本之间、周期时间与良率之间的权衡关系正被积极管理。人们需要权衡是否投入资金购买设备、雇佣人员或开发软件来缩短周期时间。(参见本系列第一部分)他们还需决定为提升良率需要多少检测和设备认证工作,有时甚至会接受更长的周期时间以换取更高的良率。(参见本系列第二部

在管理晶圆厂周期时间时,人们还会做出第三种权衡选择,这更偏向被动决策。某些实践若加以调整本可缩短周期时间,却需要克服强大的现状惯性。本文重点列举了五种此类实践:批量处理预防性维护、允许柔性专机、为停工安排批量待命、允许设备在换班期间闲置,以及使用未计入周期时间的指标。所有这些实践——尤其是最后两项——均可通过精心设定晶圆厂目标来加以影响。

订阅者专属问答

贵厂是否涉及上述任何业务?您还会补充哪些内容?下季度我们该讨论什么议题?(所有回复均以匿名形式分享。)

延伸资源

所有过往《FabTime通讯》均可通过PDF格式在《FabTime通讯》档案库中获取。请联系我获取链接,或查阅最新一期电子邮件通讯。您可下载单期内容,也可下载包含所有过往期数的压缩包。部分文章已在INFICON官网重新发布,相关链接已在上文提及处标注。

若需深入探讨这些选择如何应用于您的网站,建议您参加我们为期四小时的在线周期时间管理课程

本期延伸阅读:

我们需要您的视频内容同意
更多信息