1 Отредактировано garnizon (31-03-2024 20:33)

Тема: Стресс-тест для АГАТа

Тут в телеграм группе https://t.me/agatcomp/1/23720 поднимался вопрос:

Коллеги, есть идеи чем загружать АГАТ но ночное стресс тестирование? Стараюсь перед продажей проверять максимально работоспособность, но как показала практика, просто запустить тест памяти на сутки не всегда помогает (тест может успешно отработать сутки, а другое ПО начнет зависать).

Есть мысли такого плана:

Насколько я понимаю: стресс-тест -  это загрузка какого-либо узла системы (обычно ЦП или видяхи), которая приводит к максимально возможному нагреву этого узла и всей его системы охлаждения. При этом проверяется корректность работы этого узла. Но охлаждение ЦП или других микрух радиаторами, а также зависимость их нагрева от исполняющихся программ на Агате практически отсутствует, так как это не свойственно ТТЛ-логике, на которой он построен. ТТЛ кушает электроэнергию почти всегда одинаково и это практически никак не зависит от исполняющихся команд. Нет у аппаратуры Агата и каких-либо режимов энергосбережения. Нет и режима остановки процессора. Даже если программа ждёт нажатия клавиши, процессор просто крутит почти пустой цикл. На практике, только микросхемы DRAM у Агата могут несколько ухудшать свои характеристики при нагреве, но выход на термостабильный режим занимает около 5 минут. Так что если часик погонять тест ОЗУ, то всё, что тут можно выяснить - будет выяснено. Есть ошибки которых не выявляет тест ОЗУ, но их вообще сложно опознавать и идентифицировать. Они если и мешают, то только какой нибудь одной-двум программам. Так что для теста компа полезно только погонять разные проги, выбрать штук 10 игрушек, например, каждая из которых исполняется под 1-2 оперционками и включают все режимы дисплейного контроллера, может быть использует джойстик/пульты; может быть ещё отдельно прогу, использующую таймер. Если всё это работает - вполне можно считать комп исправным. Ну и ещё из комплексного теста тест Бейсик, если семёрка  - ещё тест ППИ.

Всё равно все мерцающие ошибки не найдёшь, а если и найдёшь - комп постепенно, даже выключенный, может где-нибудь навернуться.

Я бы вообще попросил покупателя самого предложить какие нибудь тесты. Может он ради конкретной игрули покупает комп - значит , с неё  и начинать тестирование.


А Вы что думаете?

2

Re: Стресс-тест для АГАТа

Вообще, стресс-тест может тестировать не только железку, но и софт. Например, чтобы выяснить, при каком количестве запросов веб-сервер свалится в ошибку 500 :) Поэтому нужен именно железячный стресс-тест.

С мыслью про отсутствие зависимости нагрева ТТЛ микросхем от выполняющихся программ можно поспорить.
Во-первых, ток они потребляют по разному: если выход в состоянии "1", то ток из него вытекает, причем очень маленький - десятки мкА (если, конечно, кто-то не прикрутил к нему резистор на землю, что неправильно). А если выход в состоянии "0", то ток в него втекает, причем из всех микросхем, которые к нему подключены. И в сумме там могут быть десятки миллиампер.
Во-вторых, чем выше частота изменения сигналов, тем нагрев выше. Достаточно посмотреть на тактовые генераторы.
Между прочим, нагрев ТТЛ микросхем ведет к росту тока утечки базы и току через транзистор.

Ну и пример из практики: пока к ремонтировавшейся плате не был подключен ни один контроллер, дешифратор адресов работал нормально. Но как только я установил контроллер НГМД, дешифратор сдох. Я подозреваю, что дело было в частоте обращений - опрос клавиатуры идет сравнительно медленно, а при выполнении программы из ПЗУ контроллера - обращения идут с тактовой частотой процессора, то есть, раз в 10 быстрее.

Но самое важное - это то, что разным программам нужны разные возможности и режимы микросхем будут отличаться. Например, в графических режимах данные идут в обход ПЗУ знакогенератора, в разных режимах ДК разный темп обращения к памяти и режимы работы сдвиговых регистров. Если программе нужны данные с пультов, то включаются таймеры, если программе нужны прерывания, то включается цепь генерации прерываний. Понятно, что все это не проверяется тестом ОЗУ.

К сожалению, посоветовать что-то конкретное для стресс-теста сложно, потому что каждая программа использует железо немного по разному и все возможные сочетания собрать не получится. Тут есть два варианта:
1) просто собирать такие случаи, когда какая-то программа не заработала или повисла, но тест ОЗУ при этом работает. Со временем наберется статистика и можно будет понять, какую программу лучше всего использовать.
2) начать написать специальный тест и постепенно дополнять его нужными возможностями.

А вот с мыслью, что все мерцающие ошибки выловить не получится - соглашусь. Глюки могут быть очень разные и в том числе связанные с влиянием другого оборудования.