Проект «Феникс». Роман о том, как DevOps меняет би - Страница 10


К оглавлению

10

Брент печатает что-то в одном из открытых окон, не обращая внимание на происходящее вокруг. Из его телефона раздаются звуки с обсуждения в NOC. Его, очевидно, не заботит, что звуки громкой связи могут помешать его соседям.

«Привет, Брент. Есть минутка?» – спрашивает Вэс, кладя руку ему на плечо.

«А это не может подождать? – отвечает Брент, даже не подняв глаза. – Я вроде как немного занят прямо сейчас. Работаю над проблемой с SAN, слышал?»

Вэс хватает стул. «Да, именно об этом мы и хотели поговорить».

Когда Брент оборачивается, Вэс продолжает: «Расскажи мне еще раз о вчерашнем вечере. Что привело тебя к выводу, что именно обновление SAN вызвало сбой в работе системы расчета зарплаты?»

Брент закатывает глаза: «Я помогал одному из инженеров SAN с обновлением прошивки, когда все ушли домой. Это заняло намного больше времени, чем мы думали, – все работало не так, как должно было. Ситуация была уже довольно напряженной, когда мы наконец-то закончили часов около семи.

Мы перезапустили SAN, и потом вся автоматическая самодиагностика системы стала давать сбои. Мы посидели над ней минут пятнадцать, пытаясь выяснить, что пошло не так. Именно в этот момент мы стали получать имейлы о сбое в работе системы расчета зарплаты. Тогда я и сказал «Game over».

Мы просто отставали на слишком много версий ПО. Производитель SAN, видимо, ни разу не устанавливал то обновление, которое мы загрузили. Я позвонил тебе и рассказал, что мы хотим отменить эту операцию. Когда ты дал согласие, мы начали откат.

И именно в этот момент SAN обвалился, – говорит он, качаясь на стуле. – И потянул за собой не только систему расчета зарплаты, но и несколько других серверов».

«Мы хотели обновить программное обеспечение SAN годами, но все никак не представлялось возможности, – объясняет Вэс, поворачиваясь ко мне. – Однажды мы уже почти собрались это сделать, но не смогли добиться достаточно большого перерыва на техническое обслуживание.

Работа программы шла все хуже и хуже до тех пор, пока несколько жизненно необходимых приложений не были повреждены. И в итоге прошлой ночью мы скрепя сердце решили установить-таки эти обновления».

Я киваю. Затем у меня звонит телефон.

Это Энн, поэтому я включаю громкую связь.

«Как ты и предлагал, мы просмотрели данные, которые выгрузили из системы расчета вчера. Последний платежный период в порядке. Но в этом платежном периоде все номера социального страхования для почасовых работников фабрики – полнейший бардак. А в полях с количеством отработанных часов только нули. Никто ничего подобного раньше не видел».

«Только одно поле в беспорядке? – спрашиваю я, брови от изумления взлетают на лоб. – Что ты имеешь в виду под словом «беспорядок»? Что в полях?»

Она пытается описать, что видит на экране. «Ну, это не цифры и не буквы. Тут немного червей, пики и волнистые линии… И еще здесь есть иностранные буквы с умлаутами… И никаких пробелов. Это важно?»

Брент хихикает, пока Энн пытается описать то, что видит на экране, я сердито гляжу на него. «Думаю, мы получили некоторое представление, – говорю я. – Это очень важно. Ты можешь переслать мне файл с поврежденными данными?»

Она соглашается. «Кстати говоря, полетели еще какие-то базы? Интересно. Вчера вечером все работало».

Вэс бормочет что-то сквозь зубы, заставляя Брента замолчать до того, как он успеет хоть что-то сказать.

«Ммм, да. Мы знаем о проблеме и работаем и над ней», – я абсолютно неэмоционален.

Положив трубку, я облегченно выдыхаю, благодаря богов, которые защищают тех людей, что фиксируют сбои.

«Только одно поле в базе данных повреждено? Ладно вам, ребята, это определенно не похоже на обвал SAN, – говорю я. – Брент, что еще происходило вчера, помимо апгрейда SAN, что могло вызвать сбой системы расчета зарплаты?»

Брент, развалившись, крутится на стуле, размышляя. «Ну, теперь, когда ты об этом спросил… Разработчик хронометрического приложения вчера звонил мне со странным вопросом о структуре таблицы базы данных. Я как раз вовсю работал над тестами для «Феникса», поэтому я постарался как можно быстрее от него отвертеться, чтобы вернуться к работе. Думаете, он мог сделать что-то, из-за чего полетела программа?»

Вэс быстро наклоняется к телефону, который по-прежнему работает на громкой связи. «Эй, парни, это Вэс. Я здесь с Брентом и Патти, а также с нашим новым боссом, Биллом Палмером. Стив Мастерс сделал его главой отдела IT-сопровождения. Так что слушайте, парни».

Мое желание дождаться официального объявления о новой должности кажется все менее исполнимым.

Вэс продолжает: «Кто-нибудь знает хоть что-нибудь о разработчиках, которые вносили изменения в хронометрическое приложение на производстве? Брент сказал, что ему звонил кто-то и спрашивал об изменении в базах данных».

Из телефона раздается голос: «Да, я помогал кому-то, кто имеет отношение к проблемам производства. Я практически уверен, что это был разработчик, о котором вы говорите. Он устанавливал какое-то приложение систем безопасности, так как Джону нужно было, чтобы на следующей неделе оно уже вовсю работало. Кажется, его звали Макс. У меня где-то были записаны его контакты… Он говорил, что с сегодняшнего дня уходит в отпуск, и поэтому работа такая срочная».

Вот мы и у цели.

Разработчик, вносящий срочные изменения, потому что ему нужно уйти в отпуск, – и все это, возможно, часть какого-то срочного проекта, которым управляет Джон Пеш, наш руководитель по информационной безопасности.

10