私は、ITのエンジニアではあるのですが、実質は研究員です。
Although I am an IT engineer, in practice I am essentially a researcher.
研究員というのは、新しい技術の開発と検証を行うのが仕事であり、原則として「運用」という任を負いません。
A researcher's job is to develop and verify new technologies and, in principle, does not involve responsibility for "operations."
ぶっちゃけ、
To put it bluntly,
―― 作りっぱなし
"just build things and leave them."
です。
That's how it is.
プラモデルを作ったら、その辺に放置し続けて、母親に叱られるティ―ンと同じです(と、そこまで自分の仕事を卑下する必要もないとは思いますが)。
It's like a teenager who builds a plastic model, leaves it lying around, and gets scolded by their mother (though I don't think I need to belittle my work quite that much).
---
現在、私は、大学でご指導頂いた先生からのご依頼を受け、ある運行管理システムのWeb画面を製作しているのですが、同時に「運用」も任されています。
At present, I am producing a web interface for an operations management system at the request of a professor who once supervised me at university. At the same time, I have also been put in charge of its "operation."
この「運用」が、そこそこのプレッシャ―なんです。
This "operation" part carries a fair amount of pressure.
まず、頭を抱えたのが、「(クラウド)システムが『突然死』する」ということです。
The first thing that made me clutch my head was the fact that a (cloud) system can "die suddenly."
原因不明でシステムが死ぬと、ログインすらできない状態になります。―― 死体に対して、「誰がお前を殺したんだ!」と首を掴んで揺さ振るようなもので ―― まあ、基本的には何もできません。
When a system dies for unknown reasons, you can't even log in. It's like grabbing a corpse by the collar and shaking it, shouting, "Who killed you?!"In short, there's basically nothing you can do.
仕方がないので、クラウドシステムの管理画面に行き、再起動ボタンを押すしか手がありません。
With no other option, I can only go to the cloud system's management console and press the restart button.
こうすると、とりあえずシステムは生き返るのですが、死亡原因は不在のままです(ログにも証拠が残らないケ―スが多いのです)。
This usually brings the system back to life, but the cause of death remains unknown (often, there is no evidence left in the logs).
次に問題になるのが、システムを再起動した時に、元の状態に戻っている必要がある、という点です。
The next problem is that, when the system is restarted, it needs to return to its original state.
例えば、システムの一部のサブシステムが止まったままでは、システム全体が稼働状態になりません。
For example, if some subsystems remain stopped, the system as a whole will not become operational.
そのため、『自分の手で再起動した時と、全く同じ手順で、システムを自動的に再起動させなければならない』という要件が生じます。これが、また「面倒くさい」のです。
As a result, a requirement arises to "automatically restart the system using the same procedures as when I restart it manually," and this, again, is a real pain.
一番困るのが、デ―タベ―スの内容が変わってしまうことです。
The most troubling issue is when the database contents change.
私が運用しているシステムは、一日一回、他のシステムの情報にアクセスし、変更文を自動更新する仕組みになっていますが、このデ―タベ―ス更新に失敗するのが、何より恐ろしい。
The system I operate accesses another system once a day and automatically generates change statements, but a failure in this database update is the most frightening thing of all.
手動であれば目視チェックができますが、自動変更の場合、「システムが何をやらかすか分からない」という恐怖が常につきまといます。
If it's manual, you can check it visually, but with automatic changes, there is always the fear that "you never know what the system might do."
まあ、システム運用をしている人にとっては、こんなことは「いろはのい」みたいなものだとは思います。
For people who do system operations for a living, I suppose this is all basic, entry-level stuff.
しかし、これまでの人生で「システムの安定運用」や「異常時対策」という概念がなかったIT研究員にとっては、これはかなり敷居の高い仕事なのです。
However, for an IT researcher who has never encountered the concepts of "stable system operation" or "emergency response" before, this is a job with a very high threshold.
---
思うに、現在の社会を支えている業務の多くは、この「運用」です。
It seems to me that much of the work supporting modern society consists of this "operation."
しかも、日々刻々と進化し続けるIT技術によって、現場は「どうなっているのか、さっぱり分からない」世界のなかで、祈るような気持ちで日々をやり過ごしています。
Moreover, as IT technology continues to evolve day by day and moment by moment, people on the ground get through each day in a world they "don't really understand at all," with a prayer-like mindset.
■頼むから、今日も定刻通り、電車が走ってくれ。飛び込みしたい奴 ―― 自宅に帰ってから首を括る方を選んでくれ
Please, just for today, let the trains run on time. If you want to jump, choose to go home and hang yourself instead.
■頼むから、今日も病院のシステムは止まらないでくれ。救急のピ―クは、せめて夜勤交代のあとにしてくれ
Please, let the hospital systems not stop today either. At least let the emergency peak come after the night shift change.
■頼むから、今日も金融システムは静かに動いてくれ。月末の一括処理だけは、何事も起きないでくれ
Please, let the financial systems run quietly today. At least let nothing happen during the end-of-month batch processing.
■頼むから、今日も物流が詰まらないでくれ。天候と事故と人手不足が、同時に来ませんように
Please, let logistics not get clogged today either. May weather, accidents, and labor shortages not strike all at once.
■頼むから、今日も自治体の基幹系は落ちないでくれ。住民対応の窓口が開いている間だけは、どうか耐えてくれ
Please, let the core systems of local governments not go down today. At least hold out while the service counters are open.
こうしたITシステム運用者の「祈り」によって、この社会は支えられています。そのことを、世間の人には、もっと理解し、感謝してほしいと思うのですが、
This society is supported by such "prayers" from IT operators, and I wish the general public would better understand this and be more grateful.
――『お前ら、いつも「止まった時」だけ、恐ろしい勢いで怒るだけだよな』
"You people always get furious only when things stop, don't you?"
そう言いたくなるITシステム運用者の気持ちについては、以前から理解していましたが、最近、さらに深く理解するようになりました。
I had long understood the feeling of wanting to say that, but recently I have come to understand it even more deeply.