研究員にとってアンケートや調査票は、貴重なデータです。
For researchers, surveys and questionnaires are valuable data.
しかし近年、個人情報の取り扱いはますます厳しくなっています。
However, in recent years, the handling of personal information has become increasingly strict.
率直にいえば、企業における個人情報管理の厳しさは尋常ではありません。
The strictness of personal information management in companies is extraordinary.
もちろん、このような法律上や手続上の厳格さは、研究員にとって極めて煩わしいものです。
Of course, such legal and procedural strictness is highly bothersome to researchers.
しかし、個人情報漏洩などの事故を起こしてしまった場合、単なる刑罰では済まされず、膨大な損害賠償請求やブランド価値の失墜という恐ろしい「報い」が待っています。
However, if an accident such as a personal information leak occurs, it cannot be settled with just criminal punishment; terrifying “consequences” such as enormous compensation claims and the loss of brand value await.
ぶっちゃけ、研究者にとっての個人情報とは、「致死性の毒を持つ蛇」や「ボツリヌス毒素」「VXガス」、あるいは、厳重な被曝対策なしに放置されたポロニウム210に等しい存在です。
Frankly, for researchers, personal information is like a "lethal poisonous snake," "botulinum toxin," "VX gas," or even Polonium-210 left without strict radiation protection.
今や「個人情報」とは、近づくことさえ憚られる恐怖の対象になっています。
In this way, personal information has become a source of fear, prompting one to hesitate even to approach it.
-----
『それならば』と私が考案したのが、以下の論文(p.17)で提案した方式です。
“So then,” I thought, and devised the method proposed on page 17 of the following paper.
それは、「個人情報に“見える”データを生成する方法」です。
It is a method to generate data that "appears to be personal information."
普通は「個人データから統計データを作成する」ものですが、私の方式は「統計データから個人データ“もどき”を作り出す」というものです。
Normally, one creates statistical data from personal data, but my method creates “pseudo-personal data” from statistical data.
通常は、1万人分の個人データをまとめて1枚のExcelシート(統計データ)にします。
Usually, you compile personal data of ten thousand people into a single Excel sheet (statistical data).
私がやったことは、この逆です。たった1枚の統計データから、1万人分の個人データを“生産”するという、常識外れの方法です。
What I did was the opposite. From just one piece of statistical data, I “produced” personal data for ten thousand people – an outlandish method.
こんな無茶を試みた人は(論文執筆時に一応世界中を調べましたが)いませんでした。
No one had tried such an outrageous thing (I checked worldwide when writing the paper).
この方法では、1万人分の候補グループを1000個ほど生成し、GA(遺伝的アルゴリズム)をコンピュータで全力稼働させ、その中から最も統計データに近いグループを選び出します。
This method generates approximately a thousand candidate groups for ten thousand people, runs the computer at full power using a Genetic Algorithm (GA), and selects the group closest to the statistical data.
はっきり言って、
To put it bluntly,
―― 野蛮人の発想
— It’s the idea of a barbarian.
と言わざるを得ません。全く美しくありません。
I have to say that. It’s not beautiful at all.
-----
何が言いたいかというと、今や「個人情報」とは、野蛮人の発想でもしなければ扱えないほど恐ろしい存在になっている、ということです。
What I want to say is that nowadays, personal information has become such a terrifying entity that unless you think like a barbarian, you cannot handle it.
仕事で、どうしても個人情報を収集をしなければならない人は、私の論文をご一読されることをお勧めします。
For those who must collect personal information for work, I recommend reading my paper.
個人情報“みたいなもの”を作って研究すればいいのです。とりあえず、統計的には矛盾のない「個人情報もどき」になっているはずですから。
You can create “something like personal information” and use it for research. At least, it should be statistically consistent as “pseudo-personal information.”
-----
限界までCPU性能を使い、コンピュータのファンが全力運転する騒音で何日も眠れなくなったとしても ―― それでも、毒蛇と同じ寝床で眠るよりは、マシだと思います。
Even if your CPU is used to its limits and the noise of the computer fans running at full speed prevents you from sleeping for days, still, I think it’s better than sleeping in the same bed as a venomous snake.