Server URL の設定 – Akinori Oyama

"Server URL to record captions"の設定を使うと分析サーバーの宛先を変更できます。分析サーバーに対して生成された字幕を送り、分析後の評価やオススメを拡張機能に表示することができます。

サンプル設定

https://localhost が初期設定として提供されています。信頼のおける方から紹介されたサーバーのアドレスに変更してください。

セキュリティ上のお知らせと懸念点

発話された音のデータと文字化された情報について、懸念される点についてご認識の上、URL を任意のアドレスに設定ください。

本拡張機能と付随するサーバー処理では、プライバシー上２箇所でデータ収集の可能性があります。１つ目は音声認識の部分で、２つ目は分析する部分です。１つ目は、本拡張機能では制御できないと箇所で、利用者の方が選択して使用するオンライン会議サービス(Google Meet、zoom(+http://otter.aiなど)やブラウザの音声認識などの道具によって異なります。２つ目は私の拡張機能からデータを送り分析する部分で、複数の選択肢があり、それによってデータを送信して場所や格納する場所が異なります。

１つ目の音声認識部分については、Google Meet、zoom(+http://otter.aiなどの音声認識サービス)が収集・保存する利用規約に従うもので、それぞれのサービスへの同意をユーザーの方々が独自に実施されます。次にブラウザの音声認識については、Chrome が音声データをGoogle へ送信しています。ブラウザ音声認識を有効にする際には、警告が表示されますので同意の上ご利用ください。警告にも表示されますが、ブラウザの音声認識についてGoogle の2021年12月12日時点のプライバシー文書中の該当箇所をこちらに貼り付けます。

Privacy whitepaper リンク：https://google.com/chrome/privacy/whitepaper.html#speech
Speech to text
Chrome supports the Web Speech API, a mechanism for converting speech to text on a web page. It uses Google's servers to perform the conversion. Using the feature sends an audio recording to Google (audio data is not sent directly to the page itself), along with the domain of the website using the API, your default browser language and the language settings of the website. Cookies are not sent along with these requests.

２つ目の分析する部分については、次の2-1から2-8までのそれぞれの方法によって、格納先が異なります。格納先によっては、他人からは比較的守られる箇所に保存できます。もちろん、守られた先がハッキング等によって侵入された場合は守ることができません。格納先は拡張機能の設定画面で変更することができます(https://akinorioyama.com/live-caption-analytics/help/install-and-setup/ 内の"Set URL provided by the service provider"の箇所参照)。格納先を自由に設定できるようにすることで、学習者が自分自身で文字化された音声でのやり取りを所有する権利を持っておくという理想と希望を満たすことを目的としています。
2-1) 送信も分析もしない
2-2) Google spreadsheet に字幕のみを送る
2-3) 公開されているこのソースコードを使って自分のパソコン等に展開し実行する
2-4) 公開されているこのソースコードを使用して動作していると思われるURL を宛先に使用する
2-5) 独自のコードを作成し自分のパソコン等に展開し実行する
2-6) 独自のコードを作成しているURL を宛先に使用する
2-7) ソースコードから実行可能形式(Windows ではexe ファイル)のファイルを作成し、自分自身のパソコン等で実行する。(現在のところご要望がないため実施していません)
2-8) 機密性の高い教育データ用のパーソナルデータストア(PDS)先を選ぶ (現在のところ実施予定はありませんが、宛先を指定することで実現できる可能性があります)

格納先とその危険性

2-1 の状態で拡張機能を使うこともできます。初期設定はこの状態に設定されていて、なんらかの音声認識を有効にした上で拡張機能が画面に表示する「録」の文字をクリックした場合に初めて、ブラウザの拡張機能の中で有効な場所にのみ保存を開始します。ここまでの場合、音声認識後の文字データはどこにも送信されません。しかし、拡張機能を利用される場合には、分析の実施を目的としているはずなので、ほぼ実施されないと考えます。

2-2 では、分析はされませんが、随時Google Spreadsheet に音声認識文字データを送ります。Google の当該宛先には送信されますが、拡張機能では文字データの収集も保存も行っていません。設定と準備について、こちらのページに記載してあります。

2-3 では、GitHub というソースコードを共有する仕組みに公開しているコードを利用者ご自身のパソコンに配置して使用する方法です。この場合、ご自身のパソコンにのみ音声認識文字データが保管されます。GitHub については、下記の場所に公開してあります。
https://github.com/akinorioyama/live-caption-analytics/blob/main/README.md

2-4 では、2-3 で配置する先をレンタルサーバー等にして、そのサーバーへのURL を宛先に設定して拡張機能を使用する場合です。配置先に保存されるので、そこをハッキングされることでデータが漏洩する可能性があります。URL に指定する保管先の方針によって、プライバシーの扱いが異なります。

2-5、2-6 では、拡張機能に自分自身が作ったコードと宛先を使用します。作成者の方が取り扱いたいように扱うことができます。

2-7 では、自分自身のパソコンで実行するため、外部にはデータが転送されないようにできます。ですが、実行形式ファイルを提供するとウィルスの混入の可能性があるので、実施していません。

2-8 では、もし手軽に利用できる保管先があれば、そこに保管して分析のみを一時的にデータ取得して行えるようにしたいです。