人工知能(音声認識、翻訳機能) VS 千原せいじ さん

どうも新井です。

~TL;DR対策 寝起きに作ったクソ記事全体を書き終えて思った事~

〇音声デバイスは表情や口の動き方が目に見えるよりも見えない方が現時点ではマシなのでは。(pepperよりもSiriのが友達になれそう。)

〇人間の常識が変化して、機械の言動を前向きに認識する方向に人間生物が変わる可能性有り。(進化論的な発想というより生育環境・文化的な側面から。後天的に備わるイメージ。)

〇マークザッカーバーグのようにコミュ障(僕が言っているんじゃないよ)男子が成功出来るのもIT界隈の一側面としては真実。

〇今年の新卒女子「とりあえず丸くて温度があってモフモフであれば愛情湧くんじゃないすかね。」が割と的を射ている予感。

〇タイムラグがどこまで少なくなれば心理的問題が解決されるのか誰か調べてほしい。(そんな研究結果あるかな?)→少数の言葉から文脈を先読み判断して90%以上の正答率で正しい意図を相手に伝える。とかは既存技術の延長戦上で出来なくは無いと思うため。

〇そういやホリエモンとひろゆきがどっかの書籍で言ってたな「技術が進化しても最終的に無くならないのはママが運営するスナック」って。

〇千原せいじさん マジやべえ!

※本日は文系出身で技術には素人の僕による愚痴と妄想です。細かな技術領域に関する批判は一切受け付けませんのでご了承ください。

最近、世間では人工知能、AI、IoT はたまたはシンギュラリティと流行語のように飛び交っていますね。
そんなキーワード先行の状況に辟易している今日この頃です。

WEB2.0やユビキタスという言葉がIRやメディアで氾濫していた時代はどこにいったんでしょうね。

さて、そんな事を思っている僕が今朝の5:00に考えました。

千原せいじさんと翻訳機能ってどっちが勝つんだろう。。。

と。

いや、結構マジメに考えたんすよ。

こんなことを朝からマジメに考えて脳を浪費すること自体がどうなんだというお叱りを受けて当然なのですが、まあ考えだしたら止まらないもんですね。勢いで書いちゃおう。
(こういう所が社会不適合者の一因なんだろうなw)

考えるきっかけは、

Deeplearning等の機械学習環境を活用した音声認識、自動翻訳機能を伴ったアプリケーション開発

の世界の成長速度はスゲエなあ!エゲツナイなああ!!
という点からです。(AIとか一言にせずに、せめてこのレベルまでは落とし込んで欲しいですよね、、)

正直、僕は最初にDeeplearning等の概要を勉強し出した時には、テキスト処理・画像認識が真っ先に世間に影響を与えるだろうとの考えを持っていました。

ただ、AmazonやGoogleがスマートスピーカ(車での音声認識も含む)を活用して、世界中から音声データを収集して、精度向上に努めている昨今、こっちの方が盛り上がり早そうと思ったのです。

機械学習の大まかな特徴として、データが集まれば集まるほど精度が高まる点にあります。(実際にはいくつか課題ありますが…)

その点において、世界中からエグイ量のデータが毎秒単位で集まる世界のプラットフォーマー(Amazon、Google、Facebook等を指す)のサービスではサービス精度が指数関数的に上がっていく可能性があります。

これをうまく使えば、近い将来に海外旅行で言語コミュニケーションに困らない時代が来るのでは!?と割と本気で思っています。

英語を勉強する VS テクノロジーの進化で勉強する必要性が薄まる。

の観点で

怠け心で後者に全振りした私

としては期待せざるを得ない状況です!

余談ですが、この前インドネシアに旅行して英語が殆ど通じない状況で苦労したのです…
(タクシーの値段交渉とお釣りを出す出さないが超面倒くさい…)
※ちなみに、「肝臓機能を完全に代替できる手軽で安価な人工臓器」にも期待を全振りしてお酒を飲んでいます。

さて、ここでようやく本題です。

前提として上記のアプリケーションから「言語コミュニケーション」だけでいけば問題無いとしましょう。

それでは、言語+声の大きさ、質+表情+身振り+雰囲気 それら総合的なコミュニケーションではどうなのだろうか。という話です。

ここで登場するのがコミュニケーションの鬼

千原せいじ さん

です。

彼のWikipediaより一部引用します。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーー
デリカシーがないが、その反面社交的で、人間とも動物とも打ち解けるという。世界的に有名なフィリピンのプロボクサー マニー・パッキャオが好き過ぎて、そのあまりマカオでの試合後にパッキャオのいるホテルに押し掛けてパッキャオを起こし、ツーショットで写真撮影をした。また、一時期Facebookをやっていたが、すぐに「友だち」が上限に到達してしまい、その後Facebookを閉鎖した
ーーーーーーーーーーーーーーーーーーーーーーーーーーーー

………

まさにコミュ力の化け物です。

言葉通じないのに大統領並みに厳しいはずの警護をするすると勢いですり抜けて、パッキャオとツーショット。(しかも寝てる所を起こす。)
そしてテレビを信ずる限りは本当に動物とも、原住民族ともすぐに打ち解けているようです。

それらが本当かどうかはさておき、コミュ力の化け物である事は皆さんにもご了承頂けると思います。

さて、僕は思いました。

翻訳ソフトを駆使した僕 と 千原せいじさん

では、どっちが海外で商売成功するだろう。と。

僕の結論、

正直、勝てる自信全然無え…

なのです。

いわゆる先進国では戦い方によっては勝算ありそうですが、新興国や法や社会インフラ的に未発達の国では絶対に勝てなさそうな気がします。。

というのも、ビジネスの中核部分はまだまだ人脈や人間としての双方向の信頼が大部分を占めているからです。
(シリコンバレーのIT企業も意外に政府や公権力に対して上記観点で結構、気を遣ってますしね。)

翻訳ソフトは、「言葉は伝わる」一方で、今のところはそれら以外は一切補完出来ない。のが弱点なのかなと。(とはいえ、いわゆるイントネーションや訛りはおおむね改善出来そうとの見通し)

一番の課題はどうしても「タイムラグ」が産まれる事による心理的マイナス要因にありそうです。

Aさん「OK YUSHI!Let's try to agree on contract!!(無表情でスッと握手の手が差し伸べられる)」

というシーンに出会った数秒後にデバイスから

「おーけー ゆうし。それでは契約に合意しよう」

と言われて、果たして人間は気持ちよく握手出来るのだろうか。という点です。

あくまでアラサー男子 昭和産まれの偏見ですが、終始こうしたコミュニケーションによって合意した契約では深い信頼関係は産まれにくそうな気がします。
※冒頭に記載していますが、特にその音声デバイスがpepperのようなレベルのロボットであれば僕は一層信用しません。

それよりも、言葉が通じているかどうか良く解らんラテン系の人と現地のパブで酔った勢いで意気投合して、肩を組んで一緒に踊った時に交わした「明日、現地観光のガイドしてやるぜー ハッハッハー」的な口約束を翌日本当にかなえてくれた時。
の方が深い信頼関係につながりそうな気がするのです。(この点、千原せいじさん超強そう…)

こうした要素において、やはりコミュニケーション能力ってのは「言葉を伝える」という以外の点において、今後も大事にされるだろうし、こうした点を磨いておけばレガシイ化しないコアスキルの一つとして保持出来るのではないかと思った次第です。

結論、
「ソフトウェアの技術革新」と「人間本来の心理的、認識論的な部分」との関係性は一概に語れず面白い。という事です。

補足
僕は脳科学分野が大好きなので人間の能力との対比をせずに、技術革新のみを捉えて偏向報道するメディアと社会の風潮に対して批判的に書く癖ありますが、ただの素人意見なので悪しからず。

以上です。

こんな記事に関心を持たない人を当社では募集しております。よろしくお願い致します。(ボソ)