Радиационные испытания концентратора данных на базе программируемой логической схемы Artix-7 для кремниевой трековой системы эксперимента BM@N
- Authors: Шитенков М.О.1, Дементьев Д.В.1, Леонтьев В.В.1,2, Шереметьев А.Д.1, Мурин Ю.А.1
-
Affiliations:
- Объединенный институт ядерных исследований
- Московский государственный университет им. М.В. Ломоносова
- Issue: No 4 (2024)
- Pages: 79-88
- Section: ТЕХНИКА ЯДЕРНОГО ЭКСПЕРИМЕНТА
- URL: https://journal-vniispk.ru/0032-8162/article/view/279962
- DOI: https://doi.org/10.31857/S0032816224040094
- EDN: https://elibrary.ru/NYSXKP
- ID: 279962
Cite item
Full Text
Abstract
Целью данной работы является исследование возможности применения программируемой логической интегральной схемы (ПЛИС) Xilinx Artix-7 в системе сбора данных для кремниевой трековой системы эксперимента BM@N. В условиях сравнительно невысоких радиационных загрузок ПЛИС может использоваться в качестве доступной альтернативы линейке радиационно-стойких микросхем GBT, которые в настоящее время применяются в современных экспериментах в области физики высоких энергий в ЦЕРНе, FAIR и др. Данная линейка микросхем предназначена для концентрации данных от многоканальной детекторной электроники и их последующей передачи по оптической линии связи к электронным блокам постобработки данных. В работе представлены результаты исследований чувствительности выбранной ПЛИС к радиационной нагрузке от протонов с энергией 1 ГэВ, оценена частота сбоев конфигурационной (CRAM) и блочной статической памяти (BRAM) в условиях применения данного технического решения в эксперименте BM@N. Дополнительно приводятся результаты исследования эффективности внедренных методов коррекции ошибок в конфигурационной памяти тестируемой ПЛИС.
Full Text
ВВЕДЕНИЕ
Одним из ключевых элементов современных детекторных установок в области физики высоких энергий являются трековые системы, которые применяются для идентификации треков, вершин рождения и определения импульсов вторичных частиц. Необходимость обеспечивать высокое пространственное разрешение обуславливает высокую гранулярность современных трековых систем, содержащих от нескольких сотен тысяч до нескольких миллиардов каналов. В свою очередь, необходимость сбора данных с большого количества ячеек и обмена информацией со считывающей электроникой детектора делает необходимым применение дополнительных электронных блоков для концентрации передаваемых данных. Эти блоки служат для обмена сигналами по высокочастотным медным кабелям с детекторной электроникой для последующей агрегации данных и их передачи по высокоскоростным и помехозащищенным оптическим каналам из зоны детектора с ее высоким радиационным полем на удаленно расположенную онлайн-ферму экспериментальной установки. Для решения этой задачи в ЦЕРНе было разработано семейство радиационно-стойких микросхем GBT [1], которое включает в себя концентратор данных GBTx, микросхему для медленного управления детекторной электроникой GBT-SCA, радиационно-стойкие оптические приемник GBTIA и передатчик GBLD. В паре с ядром GBT-FPGA, реализованным в программируемой логической интегральной схеме (ПЛИС), это решение может быть использовано для передачи детерминированных по времени команд управления в направлении детекторной электроники и одновременно с этим для сбора данных по высокоскоростной (4.8 Гбит/с) оптической линии связи. Для связи микросхем GBTx с детекторной электроникой используются дифференциальные цифровые линии связи формата LVDS. Микросхема GBTx была впервые применена в 2021 г. в экспериментах ATLAS, ALICE, LHCb, CMS на ускорителе LHC. Она также будет использоваться в экспериментах CBM и PANDA на ускорителе FAIR.
Однако экспорт микросхем GBT в Россию и ряд других стран находится под запретом стран-производителей, а использование нестандартной радиационно-стойкой технологии делает это решение чрезмерно дорогостоящим и неоправданно сложным в применении. В качестве доступной альтернативы линейке микросхем GBT для условий эксплуатации при радиационных нагрузках, умеренно превышающих нормальный радиационный уровень, нами был разработан электронный модуль концентратора данных на основе ПЛИС Artix-7 [2]. Технические решения, использовавшиеся при разработке этого модуля, получившего название GBTxEmulator, обусловлены в первую очередь техническими требованиями системы сбора данных кремниевой трековой системы для эксперимента BM@N [3]. В то же время используемые аппаратные и программные средства позволяют адаптировать работу этого модуля для любой считывающей электроники детектора, работающей на основе протокола передачи данных GBT, а также открывает возможность использования их архитектуры в виде стартового варианта при последующем проектировании специализированных интегральных микросхем (СИМС), аналогичных оригинальным специализированным микросхемам GBTx.
Для того чтобы использовать разработанный модуль на основе данного ПЛИС в условиях эксперимента BM@N [4], потребовалось вынести концентраторы данных на удаление – на несколько метров в сторону от мишени – для снижения радиационной нагрузки на них, удлинив при этом линии связи между детекторной электроникой и разработанным устройством. Также потребовалось интегрировать модуль обнаружения и исправления сбоев в конфигурационную память ПЛИС и предусмотреть возможность удаленной перезагрузки и прошивки платы.
За основу устройства был выбран модуль фирмы Trenz TE0712-02-100-2C [5], оборудованный ПЛИС от фирмы Xilinx Artix-7 XC7A200T. Модуль оснащен дополнительной материнской платой, оборудованной разъемами подключения к детекторной электронике, разъемом и системой питания, разъемом JTAG, двумя оптическими приемопередатчиками SFP+ и микросхемой очистителя джиттера. Блок-схема платы GBTxEmulator представлена на рис. 1.
Рис. 1. Принципиальная схема устройства GBTxEmulator.
Для коммуникации с детекторной электроникой используется модуль E-link, который рассчитан на 6 линий тактовых сигналов, 48 входящих линий дифференциальных сигналов и 6 нисходящих. В программном блоке “GBT-FPGA” реализован алгоритм приема передачи данных по протоколу GBT с сериализацией и десериализацией пакетов и методами восстановления поврежденных данных. Также протокол GBT позволяет отправлять детерминированные по времени команды на электронику детектора, что, в частности, может использоваться для временной синхронизации и передачи цифрового триггера. Этот блок взаимодействует через скоростной порт GTP по оптическому интерфейсу с ответным ядром “GBT-FPGA” [6], реализованным на более производительной ПЛИС Kintex-7. Разработанная плата обработки данных под названием “DPB” отвечает за управление, синхронизацию, прием, агрегацию и предварительную обработку данных. Более подробно схема системы сбора данных с кремниевой трековой системы эксперимента BM@N [7], в которой предполагается использовать рассматриваемое устройство, описана в работе [8].
Все модули GBTxEmulator управляются через адресную шину регистров под названием “Wishbone bus”. До установления соединения по протоколу GBT для автономного управления устройством используется минималистичный синтезируемый процессор “J1B”. Тактовый сигнал в конечном итоге восстанавливается из оптической линии связи с помощью микросхемы очистки от джиттера фирмы Silabs. Дополнительный интерфейс медленного управления по протоколу IPbus [9] реализован с применением модуля Ethernet PHY. Его можно использовать при отладке, а также как альтернативу протоколу GBT для управления по медленному каналу и мониторинга считывающей электроники. Для обнаружения и исправления сбоев в конфигурационной памяти ПЛИС путем взаимодействия с встроенными системными модулями ICAP и FRAME ECC в модуль GBTxEmulator был интегрирован блок SEM-контроллера [10].
Фотографии модуля GBTxEmulator в версии прототипа и финальной версии представлены на рис. 2. Прототип имеет более гибкий функционал благодаря разъему FMC, на который можно устанавливать мезонинные модули с различными интерфейсами ввода-вывода. Это полезно при отладке устройства и расширяет область его применения для чтения других устройств, совместимых с GBTx. Финальная версия отличается компактными размерами, выполнена в стандарте Евромеханика 3U, имеет эргономичное расположение выводов и обеспечивает согласованность и высокое качество дифференциальных линий связи с детекторной электроникой. Размещение высоких компонентов на одной стороне позволило в два раза уменьшить высоту платы до 6 HP, что важно при компоновке крейтов.
Рис. 2. Концентратор данных (GBTxEmulator) в версии прототипа (слева) и финальной версии (справа).
Аппаратные и программные решения, использованные при разработке модуля GBTxEmulator, представлены в работе [2], а применение модуля в эксперименте BM@N описано в [3]. Целью данной работы являлось экспериментальное определение частоты сбоев ПЛИС, вызванных радиационными эффектами, а также проверка работы методов устранения сбоев конфигурационной памяти ПЛИС, интегрированных в микросхему. Об эти методах [11] будет рассказано далее.
РАДИАЦИОННЫЕ ЭФФЕКТЫ В ПЛИС
Используемая нами Xilinx Artix-7 – это энергоэффективная и высокопроизводительная ПЛИС, способная реализовать большой объем вычислений, обработки ввода-вывода и конфигурируемой логики. Artix-7 XC7A200T содержит 740 DSP-блоков, 215 360 логических ячеек, 365 блоков оперативной памяти (13 Мб внутренней памяти) и 16 приемопередатчиков 6.6 Гбит/ с [12].
Все микроэлектронные устройства так или иначе чувствительны к ионизирующему излучению, влияющему на их работоспособность. В них наблюдаются различные радиационные эффекты, вызванные как накапливаемой устройством общей поглощенной дозой радиации (TID), так и эффекты, связанные с воздействием на функциональность прибора одиночных частиц (Single Event Effect, SEE). Известно, что именно последние являются наиболее частой причиной сбоев в ПЛИС [13, 14].
В процессе эксплуатации под воздействием ионизирующего излучения происходит постепенное накопление в слоях диоксида кремния интегральных схем паразитного заряда, что вызывает изменение характеристик микросхем, таких как возрастание тока утечки, увеличение задержки сигнала и дрейф порогов переключения, что при определенных дозовых нагрузках приводит к функциональным или параметрическим отказам. Оригинальная ИС GBTx способна работать при дозе в 200 кРад. Детекторная электроника кремниевой трековой системы основана на специализированной микросхеме STS-XYTER, способной выдерживать дозовые нагрузки до 800 крад [15]. Большая часть коммерческой электроники выдерживает от 5 до 100 крад. FLASH-память, хранящая программный код ПЛИС, работает без сбоев до 20 крад [16]. Существуют устройства, способные выдерживать дозу и в 10 Мрад [17]. Допустимая доза для электронного устройства зависит от технологии изготовления и типа устройства. Радиационная стойкость СИМС может быть увеличена за счет уменьшения количества оксида кремния в изоляторах транзисторов или применения охранных колец [18].
При очень больших дозах радиации в кристалле кремния, на базе которого построена интегральная схема, наблюдаются так называемые дефекты смещения, состоящие в пространственном смещении целых групп атомов кристаллической решетки [19]. Для большинства современных микросхем, которые изготавливаются по КМОП-технологии (комплементарная структура металл–оксид–полупроводник), такие явления наблюдаются намного реже, чем эффекты от накопления паразитных зарядов в слоях микросхемы. Однако следует отметить, что именно такие дефекты преобладают в перечне причин сбоев фотоприемников, солнечных батарей, силовых транзисторов, а также приборов, изготовленных на основе арсенида или нитрида галлия [20].
Наиболее серьезной причиной нарушения работы микроэлектронных приборов являются одиночные сбои, которые возникают при попадании в микросхему частицы с высокой ионизирующей способностью. Сбои такого рода классифицируются по степени своего результирующего воздействия на работоспособность микросхемы как “мягкие” и “жесткие”. Последние – достаточно редкое явление, характерное для силовых микросхем. Примеры отказов такого типа – пробой подзатворного диэлектрика, прогорание транзистора из-за возникновения проводящего канала между стоком и истоком, а также тиристорный эффект [21].
Прохождение объема ПЛИС низкоэнергетическими протонами и нейтронами характеризуется малыми значениями линейной передачи энергии (ЛПЭ) [19] в кремнии, которые укладываются в диапазоне от 0.001 МэВ ∙ см2 /мг до 0.5 МэВ ∙ см2 /мг, поэтому ИС практически неуязвима для таких частиц. При пролете протона/нейтрона с энергией более 10 МэВ существует вероятность ядерной реакции в основном материале ИС (обычно кремнии), продуктами которой являются ядра отдачи с коротким пробегом, но большой ЛПЭ (до 15 МэВ ∙ см2 /мг). Порог сбоя стандартной ячейки памяти в технологическом процессе полупроводникового производства с разрешением 7 нм находится ниже 0.1 МэВ ∙ см2 /мг. В технологическом процессе с разрешением 28 нм, в котором изготовлена ПЛИС Artix-7, это 0.3 МэВ ∙ см2 /мг, а при технологическом процессе с разрешением в 180 нм – от единицы до десятки МэВ ∙ см2 /мг. Комбинационные и аналоговые схемы в случае ионизации генерируют импульсные всплески, а запоминающие элементы при превышении критического заряда изменяют свое значение до перезаписи.
Большинство ПЛИС хранит данные конфигурации логических ячеек в статической памяти (SRAM). Данный тип памяти является энергозависимым, т. е. не сохраняет конфигурацию устройства без питания, а после включения питания ПЛИС требуется снова загрузить микропрограмму. Для ПЛИС характерна линейная зависимость объема конфигурационной памяти от количества логических элементов. Чем меньше объем памяти, тем меньше вероятность единичных сбоев [22]. SRAM-технология характеризуется более высоким потреблением энергии и большей чувствительностью к радиоактивному излучению, но при этом имеет наибольшую плотность логических элементов, сохраняет возможность многократного перепрограммирования и относительно низкую себестоимость и поэтому применение SRAM в архитектуре ПЛИС широко распространено.
МЕТОДЫ УСТРАНЕНИЯ ЕДИНИЧНЫХ СБОЕВ В КОНФИГУРАЦИОННОЙ ПАМЯТИ ПЛИС
Для уменьшения воздействия ионизирующего излучения на работоспособность ПЛИС на основе SRAM необходимо использовать методы устранения неисправностей. Поэтому сейчас активно ведутся работы над созданием и внедрением таких методов, которые позволят использовать ПЛИС в условиях повышенного радиационного воздействия, таких как космос или эксперименты в физике высоких энергий. С помощью таких методов, как очистка конфигурации, трехмодульная избыточность и кодирование с коррекцией ошибок удается добиться надежной работы ПЛИС в жестких радиационных условиях [23]. В этом разделе кратко сообщается об используемых программных методах защиты конфигурационной памяти от “мягких” сбоев, задействованных в исследуемой нами ПЛИС, и рассматриваются их ограничения.
Память конфигурации ПЛИС можно защитить от однобитовых сбоев с помощью базового блока “FrameECC”, использующего код Хемминга [24] для восстановления информации внутри блоков памяти, и внутреннего контроллера исправления ошибок SEM (SEU Error Mitigation). Совместно с этими блоками, ICAP интерфейс позволяет обеспечить чтение и запись регистров конфигурационной памяти, и тем самым позволяет SEM вносить исправления в поврежденные сегменты. Например, конфигурационная память микросхемы Artix-7 организована в виде серии 101 × 32 битовых фреймов (3232 бита). Внутри фрейма находится 32 битовое слово ECC (код Хемминга), которое используется базовым блоком FrameECC для идентификации местоположения в фрейме однобитового сбоя. Кроме того, FrameECC может определить наличие нескольких битовых сбоев в одном фрейме (MBU), но не позволяет идентифицировать их местоположение.
Конфигурационные ячейки чередуются таким образом, что физически соседние биты находятся в разных конфигурационных фреймах. Если одно событие вызывает нарушение в двух соседних фреймах, механизм FrameECC может устранить нарушения по отдельности. Из-за такого чередования многократные сбои могут быть интерпретированы одним из двух способов: как межблочные или внутриблочные.
В контроллерe SEM [10] реализованы пять базовых функций: инициализация, генерирование ошибок, обнаружение ошибок, устранение ошибок и классификация ошибок. При инициализации запускается сам контроллер, устанавливаются связи с внутренними блоками, а при использовании интерфейса UART отправляется статусное сообщение. Весь процесс занимает до 100 мс и зависит от тактовой частоты. По завершению инициализации контроллер переходит в режим обнаружения ошибок. В этом режиме контроллер позволяет программным методом обнаруживать и устранять ошибки в конфигурационной памяти ПЛИС. Блок SEM в цикле проводит сканирование значений 32 битовых ECC и CRC в каждой ячейке памяти. Один цикл занимает 18 мс. В случае обнаружения ошибки контроллер переходит в режим классификации, а затем в режим исправления ошибки. После устранения ошибки вновь осуществляется переход в цикл мониторинга сбоев.
Аппаратно-программная классификация сбоев позволяет определить, произошел сбой в “значимых” (“essential”) или в “незначимых” (“non-essential”) битах конфигурационной памяти, т. е. во влияющем или не влияющем на нормальную функциональность устройства бите данных, и тем самым определить необходимость его исправления. Режим генерации ошибок позволяет инжектировать сбои в конфигурационную память либо через интерфейс UART, либо через цифровые отдельные порты ПЛИС.
Контроллер не детектирует ошибки в блочной памяти (BRAM), распределенной памяти (DRAM) и триггерах (Flip Flop). Ошибки в таких ячейках памяти можно исправлять при помощи пользовательской логики и контрольных сумм CRC и ECC, зашитых в пакеты данных. Эта возможность и реализована в ядре GBT-FPGA и в интерфейсе E-link. Для ячеек памяти с конфигурационными регистрами и других критически важных узлов используется тройная модульная избыточность (TRM). Эта технология основана на тройном дублировании критических процессов или узлов с дополнительной системой выбора единичного результата на основе наибольшего количества голосов.
Контроллер мониторинга сбоев в текущей конфигурации работает на тактовой частоте 40 МГц при максимально возможной частоте 100 МГц. При этом имеется дополнительный модуль мониторинга по интерфейсу UART с пропускной способностью 9600 Кбит/с.
При регистрации многократного сбоя в одном фрейме контроллер выставляет статусный флаг ее детектирования и происходит автоматическая перезагрузка прошивки и реконфигурация системы, которая занимает порядка 5 с.
РАДИАЦИОННЫЕ ИСПЫТАНИЯ ПЛИС ARTIX‑7
Для проверки работы описанной выше системы обнаружения и исправления сбоев в конфигурационной памяти ПЛИС Artix-7 XC7A200T и экспериментального определения вероятности сбоя от прохождения частицы через объем ПЛИС были проведены радиационные испытания устройства GBTxEmulator на ускорителе СЦ-1000 в ПИЯФ (г. Гатчина), в которых исследовалось влияние единичных сбоев на конфигурационную память ПЛИС (CRAM). Изменения значений ячеек данной памяти может привести к изменению функционала микросхемы. Это является недопустимым и может быть исправлено только после перезагрузки, если не применяются программные методы коррекции ошибок.
Тестовый стенд состоял из платы GBTxEmulator в лабораторном исполнении на регулируемой оснастке. Плата была подключена к удаленно управляемому лабораторному источнику питания и к персональному компьютеру по интерфейсу USB/UART. Через этот интерфейс одновременно проводилась запись информации о сбоях в конфигурационной памяти ПЛИС и удаленное управление платой. Плата с тестируемой ПЛИС Artix-7, площадь которой составляла 1.4 см2 при пятне пучка 4.9 см2 , выставлялась перпендикулярно относительно оси пучка протонов. Неоднородность пучка в процессе измерений составляла не более 5%. Плотность потока частиц и поток частиц измерялись с помощью ионизационной камеры, установленной на выходе пучка из системы его вывода из ускорителя на расстоянии 150 см от тестируемого объекта. Фото тестового стенда представлено на рис. 3. Фиксировались все детектируемые сбои, их тип, время и статусная информация, подтверждающая функционирование платы. При критических сбоях осуществлялась автоматическая перезагрузка платы.
Рис. 3. Тестовый стенд для облучения протонами концентратора данных. Отмечены: 1 ─ ось пучка протонов, 2 ─ ПЛИС на плате концентратора.
Процедура тестирования была разделена на 13 этапов с различной длительностью набора и интенсивностью пучка. Интенсивность варьировалась в диапазоне от 1.5 ∙ 104 частиц/(с ∙ см2 ) до 1.5 ∙ 106 частиц/(с∙см2 ). Суммарное время облучения составило 40 ч, во время которых 5.7 ∙ 1011 протонов прошло через микросхему. Всего было зарегистрировано 2666 сбоев, из которых 126 было невозможно исправить аппаратно-программными методами коррекции (многократные сбои). Количество зарегистрированных сбоев и их классификация по типам представлены на рис. 4. Видно, что половина сбоев являются “незначимыми”, т. е. сбои произошли в битах, не влияющих на исполнение микропрограммы ПЛИС.
Рис. 4. Количество и квалификация сбоев микросхемы Artix-7 XQ7A200T, зарегистрированных в эксперименте.
Результаты испытаний показывают, что 95% сбоев конфигурации ПЛИС корректируются с помощью базового модуля FrameECC и контроллера SEM. При этом 5% событий потребуют исправления с помощью внешних средств очистки CRAM. Это может быть либо просто перезагрузка микропрограммы из внешней FLASH-памяти, либо удаленная прошивка ПЛИС при детектировании сбоя.
Суммарная ионизирующая доза составила 1.22 крад при линейной передаче энергии (ЛПЭ) для протонов энергией 1000 МэВ равной 0.0018 МэВ ∙ см2/мг.
Анализ экспериментальных данных позволяет по числу зарегистрированных сбоев конфигурационной памяти микросхемы N events оценить вероятность такого единичного события σ в принятой в микроэлектронике нормировке на бит тестируемой памяти:
(1)
где Φ – это количество протонов, прошедших через объем микросхемы за время испытания, N bits – количество ячеек памяти тестируемого устройства.
Объем конфигурационной памяти N cram ПЛИС определяется по числу фреймов, указываемому в статусном сообщении контроллера SEM. Умножив их число на размер одного фрейма (равный 3232 бита), определяем, что объем конфигурационной памяти испытываемой микросхемы Artix-7 XQ7A200T N cram = 61 094 496.
На рис. 5 представлены оценки вероятности сбоя ячейки конфигурационной памяти микросхемы Artix-7 XQ7A200T, рассчитанные по формуле (1) в отдельности для каждого из тринадцати испытаний, проведенных во время эксперимента. Погрешность определяется количеством накопленных сбоев, точностью измерения числа протонов, прошедших через микросхему во время данного тестирования, и в меньшей степени неоднородностью пучка.
Рис. 5. Вероятности сбоя ячейки конфигурационной памяти микросхемы Artix-7 XQ7A200T для различных наборов данных, полученных в эксперименте.
Результирующее усредненное по серии всех отдельных испытаний значение вероятности сбоя в отдельном бите CRAM составило (3.94 ± 2) ∙ 10–15 см2/бит.
Из документации производителя [25] известны экспериментальные значения вероятности сбоев для изготавливаемых им ПЛИС, полученные на ускорительном комплексе LANSCE в Лос-Аламосе, генерирующем пучок нейтронов широкого спектра. Подобные испытания неоднократно проводились также в экспериментах в ЦЕРНе и США [22] для близких по архитектуре ПЛИС Kintex-7 при различных энергиях и типах частиц. Эти результаты, представленные в табл. 1 совместно с аналогичными данными, полученными нами при тестировании ПЛИС Artix-7 XC7A200T на пучке протонов энергией 1000 МэВ, позволяют сравнить данные разных источников и тем самым оценить их достоверность. Действительно, семейства Artix-7 и Kintex-7 являются схожими, так как они изготавливаются по одному технологическому процессу, а вероятности единичных сбоев в спецификации от производителя равны 6.99 ∙ 10–15 см2/бит и 5.69 ∙ 10–15 см2/бит соответственно.
Эталонными для радиационных испытаний ПЛИС считаются облучения широким спектром нейтронов до 200 МэВ на ускорителе LANSCE, выполненные по стандарту JESD89A/89–3A. Их результаты представлены в табл. 1 под номером 2. Также в таблице имеются полностью аналогичные измерения от сторонней группы под номером 6. Представлены результаты испытаний с ускорительного комплекса TSL: для нейтронов широкого спектра под номером 5 и протонов энергией 180 МэВ под номером 4. Под номером 3 показана вероятность сбоя для пучка адронов энергией более 20 МэВ.
Таблица 1. Экспериментально измеренные вероятности одиночных сбоев памятей некоторых современных ПЛИС (результаты этой работы выделены курсивом).
Номер | Место проведения / Пучок | σ, CRAM, см2 /бит | σ, BRAM, см2 /бит |
1 | ПИЯФ (1000 MeV Proton) | 3. 94 ∙ 10−15 | N / A |
2 | LANSCE (“Xilinx” , WS Neutron) | 6.99 ∙ 10−15 | 6.32 ∙ 10−15 |
3 | CERN H4 (HE Hadron) | 1.50 ∙ 10−14 | 1.40 ∙ 10−14 |
4 | TSL (180 MeV Proton) | 8.29 ∙ 10−15 | 8.19 ∙ 10−15 |
5 | TSL (WS Neutron) | 6.55 ∙ 10−15 | N/A |
6 | LANSCE (WS Neutron) | 6.89 ∙ 10−15 | 6.15 ∙ 10−15 |
Данные табл. 1 показывают, что наши результаты хорошо коррелируют с результатами других экспериментов, что косвенно свидетельствуют об их достоверности. Хотя в нашем случае статистика по сбоям в BRAM отсутствует, но по данным измерений других авторов видно, что вероятность сбоя блочной памяти BRAM по величине всегда близка с вероятностью сбоя конфигурационной памяти.
Хотелось бы еще раз отметить, что не все сбои в памяти конфигурации приведут к отклонению схемы от ее предполагаемой функции, а большая часть тех, что приведут, отслеживается и корректируется аппаратно-программными средствами, зашитыми в саму микросхему. Многие биты конфигурации, связанные с логикой и маршрутизацией, не задействуются в конкретной реализации, и поэтому сбои в этих битах не влияют на схему. Конфигурационные биты, которые приводят к отказу схемы при нарушении, называются “значимыми” конфигурационными битами, а те, которые не влияют на схему, называются “незначимыми”. По некоторым оценкам [25] для среднестатистической микропрограммы “значимыми” являются не более 10% битов конфигурационной памяти. Исходя из результатов наших испытаний, “незначимыми” оказались 50% сбоев конфигурационной памяти. Фактический уровень чувствительности варьируется между различными микропрограммами ПЛИС, и для оценки этой чувствительности часто проводится инжекция неисправностей программными методами в лабораторных условиях.
РАСЧЕТЫ РАДИАЦИОННЫХ ЗАГРУЗОК И ВЕРОЯТНОСТИ СБОЕВ ПЛАТЫ GBTХEMULATOR ДЛЯ ЭКСПЕРИМЕНТА BM@N
На основе полученных данных и результатов моделирования потоков частиц, рассчитанных с помощью программы FLUKA [26], была проведена оценка частоты сбоев и полной поглощенной дозы блоком концентратора данных кремниевой трековой системы GBTxEmulator при планируемом размещении. Моделирования проведены для зоны эксперимента ( с детальной моделью установки) при энергии пучка ионов золота равной 3.5 ГэВ и интенсивностью 106 ионов/с, который взаимодействует с фиксированной мишенью, размещенной внутри анализирующего магнита.
Из всех типов частиц наибольшую угрозу представляют нейтроны, в обилии заполняющие пространство экспериментального зала BM@N. Расчеты проводились для потоков нейтронов и отдельно для полного потока нейтронов, протонов и пионов с энергией больше 20 МэВ.
Суммарный поток частиц, потенциально способных вызвать сбой ПЛИС на плате концентратора данных, которая расположена в 4 метрах справа от точки взаимодействия пучка с мишенью, составил окола 100 частиц/(с ∙ см2 ). При таких загрузках ожидаемое среднее время между сбоями (MTBF) для отдельного блока концентратора данных составит 8 часов. Многократные сбои, требующие перезагрузки и повторной настройки, будут происходить в среднем каждые 126 часов, что является удовлетворительным результатом при условии их обнаружения. Радиационный фон для частиц, оказывающих влияние на электронную элементную базу в выбранной нами зоне размещения аппаратуры, составляет 2 ∙ 10–10 крад/с. По предварительным расчетам поглощенная доза для отдельной ПЛИС, накопленная за время проведения эксперимента BM@N, не превысит 50 рад. Данное значение незначительно в сравнении с теоретическим допустимым порогом поглощенной дозы для коммерческой элементной базы платы GBTxEmulator, составляющим 5 крад [16].
ВЫВОДЫ
В данной работе показано, что современные ПЛИС на основе SRAM могут быть использованы для сбора данных с детекторной электроники, расположенной в областях с повышенной радиационной обстановкой, например, таких как кремниевая трековая система эксперимента BM@N в ОИЯИ. Однако для этого необходимо внедрять программно-аппаратные методы обнаружения и исправления сбоев, предусмотренные микросхемой, иметь возможность мониторинга и диагностики состояния системы, а также реализации функции удаленного перепрограммирования. Согласно расчетам показано, что радиационные загрузки на рабочем месте устройства вне детекторной установки не превышают допустимого порога, равного 5 крад для данных ПЛИС, а также для всей элементной базы платы GBTxEmulator даже при длительной эксплуатации системы. Среднее время между программно-корректируемыми сбоями конфигурационной памяти при прогнозируемых загрузках в области эксперимента BM@N составляет 8 часов.
На примере концентратора данных кремниевой трековой системы GBTxEmulator отработана методика радиационных испытаний электронных средств на базе протонного ускорителя СЦ-1000. Определена вероятность сбоев в конфигурационной памяти ПЛИС Artix-7 XC7A200T при воздействии пучка протонов энергией 1000 МэВ. Она составляет (3.9 ± 2) ∙ 10–15 см2 /бит, что хорошо коррелирует с результатами экспериментов на пучках с другими частицами и энергиями. Вероятность сбоя в блочной памяти BRAM можно считать аналогичной.
Экспериментально подтверждена эффективность методов обнаружения и коррекции однократных сбоев микросхемы Artix-7 XC7A200T. К сожалению, данные методы коррекции сбоев неприменимы для исправления многократных сбоев в одном кластере памяти, которые составляют 5% от всех сбоев. Тем не менее данные методы позволяют их обнаружить и исправить с помощью дополнительных алгоритмов или полной перезагрузки конфигурации ПЛИС из внешнего источника. Во время испытаний разработанное устройство GBTxEmulator полностью сохранило работоспособность после полученной дозы 1.22 крад.
About the authors
М. О. Шитенков
Объединенный институт ядерных исследований
Author for correspondence.
Email: shitenkov@jinr.ru
Russian Federation, Дубна, Московская обл.
Д. В. Дементьев
Объединенный институт ядерных исследований
Email: shitenkov@jinr.ru
Russian Federation, Дубна, Московская обл.
В. В. Леонтьев
Объединенный институт ядерных исследований; Московский государственный университет им. М.В. Ломоносова
Email: shitenkov@jinr.ru
Russian Federation, Дубна, Московская обл.; Москва
А. Д. Шереметьев
Объединенный институт ядерных исследований
Email: shitenkov@jinr.ru
Russian Federation, Дубна, Московская обл.
Ю. А. Мурин
Объединенный институт ядерных исследований
Email: shitenkov@jinr.ru
Pakistan, Дубна, Московская обл.
References
- Moreira P., Balla briga R., Baron S. et al. // Proceedings of the Topical Workshop on Electronics for Particle Physics. TWEPP09. 2009. V. 690. P. 342. https://doi.org/10.5170/CERN-2009-006
- Zabołotny W.M., Dementev D., Shitenkov M.O., Byszuk A., Emschermann D., Gumiński M., Kruszewski M., Miedzik P., Poźniak K., Romaniuk R., Schmidt. C.J. // JINST. 2021. V. 16 . C12022. https://doi.org/10.1088/1748-0221/16/12/C12022
- The BM@N STS group. Technical Design Report for the Silicon Tracking System as part of the hybrid tracker of the BM@N experiment. Dubna: JINR, 2020. ISBN 978-5-9530-0541-8. h ttp://publications.jinr.ru/record/154087
- S enger P., Dementev D., Heuser J., Kapishin M., Lavrik E., Murin Y., Maksymchuk A., Schmidt H.R., Schmidt C., Senger A., Zinchenko A. // Particles. 2019. V. 2. P. 481. https://doi.org/10.3390/particles2040029 https://shop.trenz-electronic.de/en/Products/Trenz-Electronic/TE07XX-Artix-7/TE0712-Artix-7/
- Marin M.B., Baron S., Feger S., Leitao P., Lupu E., Soos C., Vichoudis P. Wyllie K. // JINST. 2015. V. 10. C. 03021. https://doi.org/10.1088/1748-0221/10/03/C03021
- Dementev D., Elsha V., Murin Y., Sheremetev A., Shitenkow M., Sukhov N., Baranov A., Kharlamov P., Merkin M., Lavrik E., Senger A., Senger P. // Phys. Part. Nuclei. 2022. V. 53. № 2. P. 197. https://doi.org/10.1134/S1063779622020265
- Dementev D., Guminski M., Kovalev I., Kruszewski M., Kudryashov I., Kurganov A., Miedzik P., Murin Yu., Pozniak K., Schmidt C. J., Shitenkow M., Voronin A. G. Zabolotny W. // Phys. Part. Nuclei. 2021. V. 52. P. 830. https://doi.org/10.1134/S1063779621040213
- Larrea C.G., Harder K., Newbold D., Sankey D., Rose A., Thea A., Williams T. // JINST. 2015. V. 10. C02019. https://doi.org/10.1088/1748-0221/10/02/C02019
- Xilinx Corporation, Soft Error Mitigation Controller v4.1, PG036. 2022. P.4.
- Hu X., Wang J., Pinkham R., Hou S., Schwarz T., Zhou B. // Nuclear Instruments and Methods in Physics Research. 2019. V. 939. P. 30. https://doi.org/10.1016/j.nima.2019.05.045
- Xilinx Corporation. 7 Series FPGAs Overview. 2020. DS180, ver. 2.61. V.19.
- Чумаков А.И. Действие космической радиации на ИС. Москва: Радио и связь, 2004.
- Wang J.J., Katz R., Sun J., Cronquist B., McCollum J., Speers T., Plants W. // IEEE Transactions on Nuclear Science. 1999. V. 8. https://doi.org/10.1109/23.819146
- Rodríguez Rodríguez A. PhD thesis, Johann Wolfgang Goethe-Universität, Frankfurt am Main, 2020.
- Messenger G. C., Ash M.S. The effects of radiation electronic systems. New York: Van Nostrand Reinhold, 1991.
- Huang Q., Jiang J. // EPJ Web Conf. 2018. V. 8. P. 170. https://doi.org/10.1051/epjconf/201817003004
- Баранов В.В., Прибыльский А.В. // Доклады БГУИР. 2003. №1. https://cyberleninka.ru/article/n/metody-povysheniya-ustoychivosti-kmop-bis-k-vneshnim-vozdeystviyam
- Leroy C., Rancoita P. Principles of Radiation Interaction in Matter and Detection. World Scientific Publishing, 2009.
- Pearton S.J., Ren F., Polyakov A.Y. // ECS Journal of Solid State Science and Technology. 2016. V. 5. № 2. https://doi.org/10.1149/2.0251602jss
- Neale A., Seifert N. // IEEE Transactions on Nuclear Science. 2019. V. 67. № 1. P. 15. https://doi.org/10.1109/TNS.2019.2953268
- Wirthlin M., Takai H., Harding A. // JINST. 2014. V. 9. C01025. https://doi.org/10.1088/1748-0221/9/01/C01025
- Wirthlin M.J. // JINST. 2013. V. 8. C. 02020. https :// doi . org /10.1088/1748-0221/8/02/ C 02020
- Питерсон У., Уэлдон Э. Коды, исправляющие ошибки. Москва: Мир, 1976.
- Xilinx Corporation, Device reliability report, UG116. 2023. Ver. 10.17. V.92. P. 23
- Fasso A., Ferrari A., Smirnov G., Sommerer F., Vlachoudis V. // Progress in Nuclear Science and Technology. 2011. V. 7. P. 769. https://doi.org/10.15669/pnst.2.769
Supplementary files
