Valeriy Shunkov (amartology) wrote in ru_cosmos,
Valeriy Shunkov
amartology
ru_cosmos

Categories:

Он утонул (в очередной, наверное, раз о "Фобос-грунте")

Оригинал поста лежит в моем ЖЖ, сюда попросил перепостить приятель. Оригинальный пост рассчитан на совсем не подготовленную аудиторию, так что прошу прощения за возможное излишнее капитанство.

"Где-то я видел замечание, что "наш космический аппарат погиб из-за того, что оказался в космосе" – неназванный эксперт Роскосмоса.

За последние дни у меня несколько раз спрашивали о «Фобос-грунте», да и у самого кое-что накипело. Поэтому дальше будет рассказ о причинах аварии, как они видятся человеку, работающему в околокосмической отрасли.

Дисклеймер
Интернет устроен так, что после митингов все в нем становятся большими специалистами по политике, после катастроф круизных лайнеров или подводных лодок – по судоходству, и вот на днях все неожиданно начали досконально разбираться в тяжелых заряженных частицах. Чтобы немного выделиться из общей массы экспертов, я позволю себе процитировать название темы моего диплома: «Методы повышения устойчивости КНИ КМОП схем к воздействию одиночных ионизирующих частиц».
Я не академик, но зарабатываю на хлеб с маслом в одном из московских НИИ именно разработкой электроники, стойкой к воздействию радиации.

Небольшой ликбез
В космосе есть радиация. Потоки самых разных частиц летают по Вселенной – протоны, нейтрино, мюоны и прочая экзотика. В широком смысле, солнечный свет – тоже радиация. Однако нас с вами интересуют не новые игрушки астрофизиков и их коллег с коллайдера, а таблица Менделеева, большая часть содержимого которой поставляется в околоземное пространство звездами и Солнцем. Солнце – молодая звезда, которая горит за счет ядерной реакции превращения водорода в гелий. Часть ядер водорода (протонов) и гелия (альфа-частиц) процессе «работы» Солнца улетает в окружающее пространство ( солнечный ветер ). То же самое происходит и с другими звездами, только от них в космос летит все, вплоть до ядер урана.

Взаимодействие космических лучей с электронными приборами приводит к разнообразным последствиям, которые принято разделять на две основные группы: дозовую деградацию и одиночные эффекты.

Дозовая деградация – эффекты, связанные с изменением структуры полупроводника в результате накопления полной поглощенной дозы излучения. Типичный пример – возникновение паразитных каналов протекания тока и недопустимый рост энергопотребления микросхемы. Дозовая деградация может привести и к функциональному отказу, но в современных приборах параметрические отказы обычно наступают раньше. Дозовая стойкость обычных коммерческих микросхем (таких, которые стоят в любом телефоне или компьютере) позволила бы им продержаться на орбите несколько недель или даже месяцев(на самом деле они перестали бы работать гораздо раньше, но по другим причинам). Специализированные микросхемы должны (и могут) выдерживать на орбите до пятнадцати лет.

Одиночные эффекты, они же эффекты, связанные с воздействием одиночных ионизирующих частиц – это сбои и отказы, связанные с воздействием отдельно взятой пролетающей частицы. Возможные последствия включают в себя физическое уничтожение транзистора или группы транзисторов (эдакий ядерный взрыв в отдельно взятом куске кристаллической решетки), но обычно все ограничивается сбоем или «защелкой».

Одиночный сбой – переключение в запоминающем элементе (оперативная память, кэш-память, флэш-память и т.д.). Когда тяжелая заряженная частица попадает в закрытый транзистор, в нем возникает импульс тока, переключающий ячейку памяти в противоположное состояние. Лечится применением более надежных (и более сложных) запоминающих элементов, дублированием информации или кодированием.

«Защелка» (она же latchup , она же тиристорный эффект) – переход паразитной тиристорной структуры в низкоомное состояние. В результате возникает короткое замыкание между землей и питанием со всеми вытекающими (неработоспособность и опасность «выгорания» микросхемы). Лечится выключением питания и перезагрузкой системы.

А теперь собственно
Мысли о падении «Фобос-грунта»

«Космический аппарат "Фобос-Грунт" состоял из 95 тыс. микросхем, 62% из которых не должны были использоваться в космической отрасли, так как имели класс industry».
«пояснил, что микросхемы делятся на три класса - бытовые, industry и space, из которых только последние можно использовать для строительства космических аппаратов, поскольку они обладают свойствами живучести в условиях космоса».


Во-первых, класса «space» не существует в природе. Во-вторых, классификация «commercial-industrial-military» относится к температурному диапазону, в котором может работать микросхема, а не к отрасли, где ее можно применять. Например, требования автомобильной электроники гораздо жестче, чем просто industial исполнение (очень жесткие нормы на повышенные температуры и вибрации).
Общепринятой классификации по радиационной стойкости не существует, производители явно показывают основные параметры (стойкость к поглощенной дозе, мощности дозы, нейтронам, «защелке» и одиночным сбоям), от соотношения которых зависит возможности применения микросхемы в той или иной отрасли (военные, космос, АЭС и т.д.). Существуют понятия Radiation Hard и Radiation Tolerant, но они трактуются разными производителями по-разному.

Официальное заключение межведомственной комиссии по анализу причин нештатной ситуации, возникшей в процессе проведения летных испытаний космического аппарата «Фобос-Грунт» гласит:
«Наиболее вероятной причиной перезапуска двух полукомплектов устройства ЦВМ22 БВК является локальное воздействие тяжелых заряженных частиц (ТЗЧ) космического пространства, которое привело к сбою в ОЗУ вычислительных модулей комплектов ЦВМ22 во время полёта КА «Фобос-Грунт» на втором витке. Сбой ОЗУ мог быть вызван кратковременной неработоспособностью ЭРИ вследствие воздействия ТЗЧ на ячейки вычислительных модулей ЦВМ22, которые содержат две микросхемы одного типа WS512K32V20G24M, находящиеся в едином корпусе параллельно друг другу. Воздействие привело к искажению программного кода, что стало причиной «рестарта» двух полукомплектов ЦВМ22».

Гугл сообщает, что серия микросхем WS512K32 компании White Electronic Designs Corporation – это статическая память (SRAM) объемом в 8 мегабайт. Минимальное напряжение сохранения данных составляет два вольта, и это означает, что проектные нормы с высокой вероятностью составляют 350 нм или больше. Радиационностойкие приборы с такими проектными нормами производятся в России уже несколько лет, и разработчикам «Фобос-грунта» ничего не мешало заказать российские аналоги сбившегося чипа.

Последняя буква M в маркировке означает военное исполнение, то есть температурный режим работы -55 - +125 градусов Цельсия и соответствие американскому стандарту Mil-Std-883. 883-й стандарт задает множество параметров, которым должна соответствовать микросхема для военных применений – вплоть до устойчивости к выстрелам. Есть в этом стандарте и радиационная часть. В нее входят тест на полную поглощенную дозу, мощность дозы и воздействие нейтронов. Это тесты, гарантирующие, что ракета с ядерной боеголовкой долетит до цели после атмосферного ядерного взрыва.

Про одиночные сбои в стандарте Mil-Std-883 нет ни слова, и это неудивительно: время полета баллистической ракеты измеряется не в месяцах, а в минутах. «Военные» микросхемы, безусловно, существенно лучше обыкновенных переносят воздействие радиации, но их нельзя просто взять и поставить на спутник – они защищены от других типов излучения, нехарактерных для космоса. NASA и ESA ежегодно тратят огромные деньги на разработку специализированных чипов, подходящих для долговременной эксплуатации, а Роскосмос продолжает ставить на спутники черт те что.

Итак, официальная версия – одиночный сбой в микросхеме памяти, последствия которого не удалось исправить из-за программной ошибки. Похоже ли это на правду? Да, похоже. Одиночный сбой в важном блоке памяти, «повиснувший» вычислительный комплекс… Только это похоже не только на правду, но еще и на плохо спроектированную систему.

У вычислительного комплекса было два канала – неплохо, хотя можно было сделать лучше. Но вот только, согласно официальной версии, от одного сбоя в ячейке памяти вышли из строя оба канала вычислительной системы. И вот это уже провал, причем полный, безоговорочный и непростительный. Я не обладаю информацией о том, как именно была организована электроника «Фобос-грунта», но у меня есть один простой вопрос:

Почему данные в памяти не были продублированы или закодированы?

Разумный ответ на этот вопрос у меня только один: принимая решение о полной замене старой аппаратуры на новую, конструкторы не потрудились пересмотреть требования к элементной базе. У электроники двадцатилетней давности и современных схем очень разные проблемы: старые схемы менее чувствительны к одиночным сбоям (за счет большей энергии переключения) и более чувствительны к дозовой деградации (из-за большей толщины диэлектриков). При уменьшении размеров элементов чувствительность к полной дозе падает (либо изменяются ее причины), а чувствительность к одиночным сбоям растет. Если не принять все это во внимание и составить техническое задание по старым требованиям, то на выходе получится продукт, который «погибнет из-за того, что окажется в космосе».

А ведь все, что требовалось, чтобы избежать проблем - поставить кодер Хэмминга, который легко реализуется и аппаратно, и программно, мало влияет на быстродействие и ненамного уменьшает полезную емкость памяти.

При этом к непосредственным разработчикам придраться сложно – они же наверняка сделали все в строгом соответствии с ТЗ. Вопросы именно к тем, кто проектировал всю систему и составлял ТЗ на отдельные компоненты. И если я прав с этой версией, то у «Фобос-грунта» не было ни единого шанса долететь до цели. И у уже запланированного «ФГ-2» их тоже не будет.

С этим неутешительном выводом я позволю себе перейти к следующему пункту – выводам, которые сделало руководство Роскосмоса.

Рассуждения об интервью В. Поповкина
Глава Роскосмоса В. Поповкин цитируется по его интервью на радио «Эхо Москвы» и по интервью газете «Известия».

Ю. Коптев: «Более половины микросхем, использованных при создании "Фобос-Грунта", могли использоваться в промышленности в нормальных земных условиях, но не были предназначены для работы в космическом пространстве».

В. Поповкин: «Фрегат порядка тридцати килограмм весит. Там только отечественная элементная база. В этом (блоке «Фобос-грунта») она весит полтора килограмма, но она (элементная база) импортная. Штатные микросхемы при воздействии тяжелыми заряженными частицами действительно, дали сбой. Но суть в том, что вообще есть проблема импортной электронной компонентной базы.

Озвученная «проблема импортной электронной компонентной базы» состоит в том, что многие американские радиационностойкие разработки так или иначе имеют отношение к Министерству обороны США и, следовательно, запрещены к экспорту в Россию согласно поправке Джексона-Вэника. Это не помешало микросхеме с литерой «М» появиться на «Фобос-грунте» - многое все же продается – в основном несложные схемы типа статической памяти (которая в итоге и навернулась). Например, в России есть представительство занимающейся спецстойкой памятью компании Aeroflex. Однако самые новые разработки купить в Россию легально нельзя.

В итоге большинство российских спутников (а также, например, военных самолетов) оснащается серийными зарубежными микросхемами, проверенными на то, что они работают при воздействии радиации хоть как-то. Это называется «радиационная разбраковка» - из партии в несколько тысяч коммерческих микросхем (у которых очень большой разброс параметров радиационной стойкости) обычно удается найти несколько десятков приемлемых экземпляров. При этом речь обычно идет только о дозовой стойкости, но не об эффекте «защелки» и одиночных сбоях: для увеличения стойкости к ним без специальных мер не обойтись.
Справедливости ради, часть современных схем демонстрирует сносные показатели по многим параметрам, но далеко не по всем – и уж точно на них никак нельзя собрать спутник, способный проработать на орбите пятнадцать лет без сбоев и отказов.

Лирическое отступление: развенчиваем мифы
Существует (причем даже в среде специалистов по микроэлектронике) миф о том, что технология «кремний на изоляторе» (или ее подвид «кремний на сапфире») - панацея от всех проблем, связанных с радиацией. На самом деле, КНИ в силу конструктивных особенностей полностью избавлен от эффекта «защелки», но его стойкость к дозе и одиночным сбоям может быть даже хуже, чем у традиционной технологии.

"Федеральное космическое агентство вводит собственную ведомственную приемку космической продукции. Это будут эксперты и представители, которые могут в любую минуту остановить производство и попросить приехать из Москвы экспертную группу с целью выяснить - соблюдаются ли там технологическая дисциплина, правильны ли те технические решения, которые приняты".

Я вот прямо вижу сейчас экспертов из Москвы, выезжающих на фабрики Honeywell, Aeroflex и Atmel. Но если серьезно, то почему же ставят на спутники «плохие» микросхемы? Господин Поповкин сообщает, что это из-за того, что отечественных аналогов у нас просто нет.

В. Поповкин: Сегодня мы не можем одним мгновением, создать отечественную электронную компонентную базу. Нам надо перепрыгнуть через 2-3 поколения микросхем.

Существующий уровень проектных норм новых радиационностойких схем американского и европейского производства колеблется между 350 нм (Sandia Labs) и 180-150 нм (Honeywell), в том числе – относительно недорогих схем на базе коммерческих технологий (с защитой от сбоев при помощи кодирования). Перспективные работы в США посвящены технологии 90 нм (Sandia Labs). Микросхема, сломавшаяся на «Фобос-грунте», с высокой вероятностью была изготовлена по проектным нормам около 350-500 нм.

В России на сегодняшний день разрабатываются и производятся (sic!) радиационностойкие микросхемы с проектными нормами 350 нм и обыкновенные – 180 нм. Перспективные работы включают исследования по технологиям вплоть до 65 нм (такие, к сожалению, в России можно только разрабатывать, но не производить). По факту, мы отстаем от американцев максимум на одно поколение, и это отставание обусловлено исключительно недостатком финансирования – именно потому, что вместо того, чтобы заказать микросхемы российским компаниям, Роскосмос покупает иностранные.

В России есть несколько коллективов, способных разработать радиационностойкие микросхемы любой сложности для любых целей и провести все необходимые испытания для подтверждения их характеристик. Только вот заказов у российских предприятий существенно меньше, чем потребностей у российской космонавтики. Почему? Потому что за разработку микросхем надо платить, и платить много. Кстати, покупка американской элементной базы с учетом необходимых испытаний выйдет ненамного дешевле разработки собственной даже в среднесрочной перспективе, но ведь заказ на покупку американских чипов можно отлично провести через фирму дочери какого-нибудь заместителя генерального директора (я сейчас не имею в виду никого конкретного). И это не говоря о высоких вещах типа национальной безопасности, которыми очень любят оперировать генералы, подписывающие разрешения на покупку иностранных микросхем.

Каковы перспективы космической микроэлектроники в России? Конкурировать с компаниями, производящими ширпотреб – Intel, AMD, TSMC, UMC – сложно, хотя заводы «Микрон» и «Ангстрем» имеют довольно много зарубежных заказов, например, от производителей компьютерной периферии и калькуляторов. Но это сегмент, в котором востребованы устаревшие технологические процессы – то есть тот, в котором конкуренция ниже обычной.

Если же говорить о по-настоящему передовых разработках, то российские предприятия и исследовательские институты вполне могут быть конкурентоспособны во многих сферах, где от приборов требуется не минимальная цена при многомиллионных тиражах, а качество и надежность – силовая электроника, СВЧ-приборы, электроника для космических применений. Только для этого надо перестать покупать американские микросхемы и вложить эти деньги в российские предприятия – реально работающие предприятия, а не нанопрожекты типа «Сколково». Но это уже будет совсем другая история.
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 98 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →