о сумасшедшем доме
18-05-2007 00:38
к комментариям - к полной версии
- понравилось!
я не знаю что такое в последние два дня происходит с железом, но это просто кризис какой-то.
вчера у нас с ума сошел сервер терминалов. пока нагрузка на него не превышает 50-60% все работает хорошо. но как только переваливает этот рубеж, сразу скачет до 100%, от чего керио переставало пропускать пакеты на сервер sql. и так висит 5-10 секунд. после чего 1с отпадает не сумев достучаться до базы данных.
параллельно с этим сгорел один из свичей на рознице (по крайней мере мы так подумали).
Быстренько выгрузили лишний хлам с сервака, поменяли свич, после чего работоспособность восстановилась. Но через полчаса опять 100% загрузки, и до кучи отпал сервер видеонаблюдения.
Обратили внимание что спуллер принтеров много жрет системного времени. Перенастроили его по мелочи. Перегрузили видео.
Опять помогло на полчасика. Приняли решение собрать новый сервер терминалов, и завтра запустить его как основной, а старый перевести на скамью запасных.
Скрутили на базе обычного десктопа с 4гб памяти. настроил, активировал, все барахло поставил. И тут он перестал загружаться. После долгих мучений (обновлений прошивок, мемтестов), выдернули 4-ую плитку памяти, он завелся и стал работать стабильно. День закончился.
Сегодняшний день был еще страшнее. Утром я завел все нужные учетные записи на новый сервер терминалов, переставил все принтера. И только решил сесть на место и расслабиться, как вдруг видео опять отвалилось. Пошли разбираться. Там полный маразм. Снаружи пингуется в течение 5-10 минут, потом перестает, до тех пор пока с него не обратишься к сети. Отключили все что можно в настройках, все возможные функции энергосбережения. Отключили в биосе все что могло конфликтовать по прерываниям. Херня одна и та же. Поменяли сетевуху, и только включаем - сгорел блок питания на новом сервере. Отправили новый блок, там Васёг перекрутил его, включил сервер -- нет соединения с sql. оказывается вместе с блоком питания сгорела гигабитная онбордовая сетевуха. Вставили новую, линк поднялся. Вся эта херня сопровождалась диким воем розницы, офиса, бухгалтерии.. мол невозможно работать. сделайте что-нибудь.. когда наконец заработает?
Как только скуэль увидели, свич на рознице повис. Решили больше не мучаться с длинковым свичем (больше ничего не было под рукой) отправили водилу за 3com.
Воткнули его, все кабеля и на всех компах повисла надпись "сетевой кабель не подключен". Почесали затылок - наверное какой-то из кабелей замкнуло. Вынул все и втыкал по одному. где-то на 11-ом кабеле свич повис. кабель вынул - внутри свича компы видно, а аплинк не идет. Опять сначала.. и так пару часов. В итоге выявили 4 конца, два из них вешают свич, а два просто никуда не ведут. пара минут мата от души на сотрудников кои это сотворили.
День кончился заменой блока питания сервера со временного на более-менее приличный. Теперь держим пальцы крестиком. Если завтра днем эта тварь хоть пару раз упадет придется всю субботу там дежурить. :)
и осталась не решенной одна проблема. проблема NAT. раньше эта роль возлежала на сервере терминалов, а теперь больше не хочется. Охх...
Но все же такие встряски иногда полезны. Только надо выпить основательно и завтра в бой, с новыми силами.
вверх^
к полной версии
понравилось!
в evernote