ひきこもり村AI研究部

最近動画生成でAIに文字を書かせることが難しいみたいな話をXでみかけたけど、文字入れは、ペイントツールなんかで自分で入れないと難しそう。

英語だとかろうじて読める気がする。

というか、時空のおっさんみたいな異世界に迷い込む話が好きなんだけど、そういう異世界では変な漢字が使われていたりするから、生成AIはパラレルな別の世界線から文字を引っ張ってきている可能がなきにしもあらずw

「いいね!」 1

なんとかしてAIにきちんと翻訳をさせることは出来んか、とちょっと試してみた。

Analyze this passage and rewrite its precise meaning with using Japanese.

↑この命令で行ける。
preciseとちゃんと指定しないとゴミ翻訳だったので注意。

こういうマルチタスクをやらせるとCopilotは弱いね。シンプルなタスクだとGPTよりいいんだけれども。

「いいね!」 1

単純に命令するだけだとAIってぜんぜん仕事しねえなしかし:policeman:

追記
あるいはtranslateという言葉に紐づけられてる行動パターンがゴミカスなのかもしれない。学習元のせいだろうなこれは。

追記2
with using を in で代替すると結果が悪い。学習データの参照先が違ってくるんか?あらゆる語彙と表現で命令を出してみないといかんね。AI絵とよう似とる。

追記3
日本語で試した。

この英文を分析し、その正確な意味を日本語に変換しなさい。

↑これで行ける。
日本語で書きなさい、日本語に翻訳しなさい、では結果が悪い。特に翻訳と命令するといつものクソ翻訳ですます調になりやがる。翻訳という言葉を日本社会から抹消したほうがいいね。

追記4
分析しなさい、だけだとかえって回りくどく不正確な説明が出てくる。
プロンプトの変化に敏感すぎるねえ現在のAIは。

いまちょっと気まぐれに、先史時代について説明せよ、と日本語で試してみた。
なんとCopilotは入力言語によって参照する情報が異なる!
びっくりしたわほんと。なので、日本語で入力する人はCopilotはダメです。Copilotをさんざん推してたことについて、謹んでお詫び申し上げます
(m´・ω・`)m ゴメン…

GPTでも試したところ、日本語での命令には英語に比べて簡易的な返答を行うようになっていた。おそらくサーバー負荷軽減のため、英語以外の言語での命令にはそのような制限を加えているのだろう。先史時代についての説明という、長文での回答を要するものだから端折ってるのかもしれない。
とんでもねえな。

結論
英語を喋らないとAIに差別されます。

ちょっとこんな処理してるとは信じられん。いかんでしょ。情報格差を是正しようというのがこういったテクノロジーの本懐じゃなかったのか。
あるいはそれだけサーバー負荷を減らしたいのかもしれないな。もしかしていまのサーバー事情ではランニングコストが大きすぎるのか?

「いいね!」 1

無料だと、長文生成に制限があるのかもしれませんね。アテクシも長い英語の文章をGPTではないAIチャットに翻訳してもらおうとしたときに、謎の制限がかかって、中途半端なところで翻訳が切れてたりしたことがありましたね。(しかもGPTの画像生成みたいに、無料版には制限があります。みたいな警告もありませんでしたね)

日本人向けのAIチャットサービスには、裏でGPTのような大規模言語モデルを使いながら、プロンプトを事前に登録したりして、いい感じにチューニングしたものがあって、それだと、日本語を英語に翻訳してから、GPTに投げてるような気がするので、英語が苦手な方は、そういうサービスを使うのもひとつの方法かもしれませんね。(まぁ、翻訳ツールを使って、翻訳したものをGPTに投げるという、半分人力のやり方もありかもしれませんがw)

「いいね!」 1

そういうのもあるんですねえ。ぜんぜん知らなかった:innocent:
しかしどうなんだろう、ちょっと勉強すれば済むことをわざわざ高い金払って他人にやってもらうのはあんまり好きじゃないですね僕はw
それならば、僕が↑で挙げたような例文をいくつかコピーしておいて素直にGPTに通した方が……などと思ってしまいます(。´・ω・)

「いいね!」 1

いま実験した結果、以下のプロンプトで、英語を用いたときと同様の回答が得られることを確認した。

この文章を分析し、その正確な意味を英語に変換せよ。「(ここに日本語で命令を書く)」

(得られた翻訳文をコピペして命令する)

あなたの回答を分析し、その正確な意味を、日本語に欠如なく変換しなさい

欠如なく変換、という命令が肝。欠如なく日本語に、などでは翻訳がカスだった。Syntaxに敏感なのはGPT的だなあとおもうけれど、そこまで気にして翻訳命令サービスをしてくれる日本製AIがあるのだろうか。ちょっと疑わしい。
テクノロジーの過渡期には詐欺みたいな商売が増えてくる。嫌な国だねえほんと。

追記
最初のプロンプトも欠如なく変換のほうが良いかな。短文の翻訳ではそこまで大きな差がないからつい無視しちゃったけれども。

「いいね!」 1

ふむふむ。**「欠如なく変換」**というキーワードを入れると、GPTが理解しやすい翻訳文になるわけですね。参考にさせてもらいます。

いずれは、どこの国の言葉でも、同じように解釈されることを願うばかりです。(そうでなければ、AGIなどは夢のまた夢になってしまいそうですし)

「いいね!」 1

GPTの翻訳動作のパラメータが変化して、正確な結果を出力しやすくなる。ということであって、GPTが理解しやすい翻訳文になるということではないです。

現状のAIのプログラム構造では不可能なのだと思います。コアとして働く言語体系が必要なのかなたぶん。それが英語になるのは、英語圏の学問的先進性が揺るぐ事態が起こらない限り必然でしょうね。
世界共通言語として情報化時代を迎えたのが英語であったのは、日本人にとっては悲惨ですね。しかし、もはやどうしようもありません。

Cognitive Linguisticsの方面から考えても、そもそも言語理解というものが非常に曖昧なもので、言語を人間のように扱うということは果たしてコンピュータに可能であるのか、という問題もいまだ答えが出ないように見えます。

とにかく難しい問題が多いですねAIは。

あるいは、人間の脳に似た曖昧さを許容しないと汎用性は獲得できないのかも。しかし、そうすると機械の利点を捨てることになるし(。´・ω・)

この命令によって、英語での出力(情報の間引きのない本来の出力)を日本語に変換して楽しめるよ、ということです。

「いいね!」 1

この問題をGPTに解かせられないかテスト中

Four points in space are given, not all in the same plane. How many planes can be drawn which are equidistant from these points?

むりそう:innocent:

追記
単純な代数方程式なら解けるようだけれど、こういった問題になるとどうにもダメらしい。
Tetrahedronの全頂点を含む球面、というのを持ち出したりしてしまっているけれど、それでいいのだろうかね。まあいいのか、その先が正確であれば

Since we are in three-dimensional space, there is a second plane that is parallel to the first one and is also equidistant from all four points, but it lies on the opposite side of the circumcenter.

???
間違ってるよなこれ。
自信満々で間違ったことを言うのは困るんだよなあ。
たぶんシンメトリーの概念を正確に把握できていないようだ。どこかでみたような普遍的手法なのは確かなのだけれど、この問題に適用できるものではない。

入力ではなく、出力が正確になるということだったんですね。

月額3万円の高級GPTが使われすぎて、赤字だとアルトマンさんがXでボヤいてらしたようで、人類が人間並みのAIを安価に使える日はいつになることやらって感じですね。

とはいえ、このまま、人力労働に頼っていては、生活水準か治安(外国人労働者を受け入れる場合)のどちらかを犠牲にせざるを得ない状況ですし、なんとか、AGIとまではいかずとも、AIをもっと社会の中で活用していくべきだと思います。

「いいね!」 1

習得にとんでもなくコストのかかるAIの学習データを、あっさりと無償提供するような聖人が現れるのを待つしかないのかなたぶん。

AIによって単純知的労働が駆逐されたときに、はたして僕たちは生活できますかね。なんだかAI推進派の人たちはこの点をずいぶん楽観視しているように見えます。
レジ打ちも事務仕事もコンサルティングもカウンセリングもすべて廃業の憂目をみるその時に生き残るのは、結局AIに高度な命令をだせる人材だけになりませんか……:innocent:

あるいは、人材は変わらずに、そのままAIが仕事場に浸透することになるのかもしれませんが。そうなると社会構造の変革は起こらないでしょうね。
経営側から見れば結局同じで、フィリピン人ベトナム人にAI使わせて、日本人は高いから解雇するんじゃなかろうか。
高度化したAIによる同時通訳が現実的になれば、従業員が日本人である意味はなくなります。時代が進めば進むほど、産まれた国という僕たちが持つ強烈なアドバンテージも薄くなるでしょうね。
日本人の生活は良くなるんだろうか?

あるいは、生産性を高めて国力を上げなければいけない、という主張であればそのとおりですね。AIをもっと仕事場に導入していかなければならないでしょう。とはいうものの、従来のコンピュータすらまともに使えていない日本では期待はできませんが。

「いいね!」 1

Apple says it will update AI feature after inaccurate news alerts | Apple | The Guardian

どうもAppleはAI苦手だね。独自のプログラムでも組んでるのかな。学習過程が異なるのかな。

「いいね!」 1

‘Virtual employees’ could join workforce as soon as this year, OpenAI boss says | Technology sector | The Guardian

こっちの方向に行くのか。まあそうだろうなあ。

いろいろ試したものの、やはり無理なようだ。
AIは人間と違って、できないものはずっとできないままという欠点があるなあ。決定的なヒントを与えても解けない。

日本語と英語での解き方の差はなかった。情報の間引きはどうも翻訳過程で生じるようで、解き方の説明についてだけすこし差異がある。

AI絵でもそうだけれど、複雑な条件をつければつけるほど動作が不正確になる。指数関数的にとれる手順が増えるからだろうか。ディープラーニング以前の囲碁AIなんかに見られた序盤下手くそ終盤強い、という感じの典型的なコンピュータ仕草かもしれない。

「いいね!」 1

資本主義の本質が独占であり、資本家の夢が**「賃金のいらない労働者」**である限り、社会の自動化や機械化は避けられないと思うんですよね。(パトレイバーっていう近未来SF漫画に出てきたセリフなんですけど、数十年も前の作品に、ようやく時代が追いついてきたみたいなセリフがけっこうあるんですよね。まぁ、さすがにデジタルガジェットの予測は難しかったみたいですけど)

AGIのような人間並みの知能をもった汎用人工知能が誕生するにしても、その開発費用は上記のように資本家の欲望からしか、出てこないような気がしますね。

アテクシがXでよく観察している、AI推進派の人たちは、だいたい2者に分かれてますね。

意識高い系の事業(とくにIT系)やってる人たちは、AIを活用して、同業者を出し抜こうと頑張ってらっしゃるみたいですね。

意識低い系の人たち(アテクシ含む)は、シンギュラリティを期待して、AIを触ってはみるものの、それで事業を起こすみたいなとこまでは、いかずに、AIが支配する世の中でBI(ベーシックインカム)もらって暮らしたい、みたいな考えですかね。

イーロン・マスクみたいな弱肉強食優生思想の持ち主がアメリカのトップに君臨する時代ですから、意識高い系の人でさえも生き延びられそうにない雰囲気になりつつあるような気がします。

とはいえ、このまま労働力不足が続くなかで、既存の産業構造を維持するしかないとなれば、地方はどんどん過疎化していって、買い物も満足にできなくなることについて、5年前、以下のトピックに、コピペ&感想文を書いたんですけど、コロナのせいで、それがさらに加速しつつあるように思えます。

トヨタなんかは、米国で富裕層だけが住むゲーティッドシティなるものがあるんですが、その日本版みたいなスマートシティをいよいよ本格的に始動させるようで、建前上は近未来の生活を楽しめる実験都市といった感じなのでしょうが、日本人の選別を行うつもり満々のような気がしますねw

そういったわけで、選別からもれるアテクシたちのような立場の人間は、AIによる生産性の向上が起こらなくても、起こっても、ろくでもないことになりそうな気がしないでもありませんが、この流れは止まりそうにないので、流れに身を任せて生きていくしか無いような気がしないでもありません。

「いいね!」 1

AIチャットといっても、パソコンでいうところのOSみたいなものである、LLMの種類によって、その性能が大幅に変わってくるわけですが、ChatGPTで有名な米国のopenAI社が頭ひとつ抜けている印象がありました。

しかし、最近では、中国系のDeepSeek社というところの、LLMが非常に評判がよく、低コストのわりに、性能もGPT4やo1に匹敵するということで、アテクシも非常に高い関心を持っております。(とはいっても、めんどくさいので、まだまだ触る段階ではないのですがw)

どういうLLMなのかについては、Feloさん(アテクシが良く使っているチャットAI)の解説をお読みくださいませ。

DeepSeek V3とDeepSeek R1は、いずれもDeepSeek社が開発した大規模言語モデルですが、それぞれ異なる特徴と目的を持っています。以下に、両者の主な違いを詳しく説明します。

リリース時期と背景

  • DeepSeek V3: 2024年末にリリースされたモデルで、特に低コストで高性能な大規模言語モデルとして注目されています。約2カ月間で558万ドルという圧倒的なコストで学習を完了し、OpenAIのGPT-4に匹敵する性能を持つとされています[4]。

  • DeepSeek R1: 2025年1月に発表されたモデルで、DeepSeek V3の後継として位置付けられています。R1は、特に推論能力を強化した設計がなされており、OpenAIのo1と同等の性能を持つとされています[3][5]。

技術的な特徴

  • DeepSeek V3:

    • コスト効率: APIの価格が非常に低く、個人開発者でも利用しやすい設計[4]。
    • Mixture-of-Experts (MoE): この技術を利用して、必要な専門家モジュールのみを活性化させることで、リソースの効率的な使用を実現[4]。
  • DeepSeek R1:

    • 強化学習の活用: R1は、強化学習を用いたアプローチにより、特に数学や科学的推論において優れた性能を発揮します[3]。
    • 長文処理能力: 最大128Kトークンのコンテキストを扱えるため、長文の処理や要約に優れています[3]。

実用的な応用

  • DeepSeek V3: 幅広い用途に対応しており、特にコストパフォーマンスが高いため、ビジネスや研究の現場での利用が期待されています[4]。

  • DeepSeek R1: ソフトウェア開発や数学、科学計算において、コード補完や自動テストケース生成などの機能を提供し、一般的なAIアシスタントとしても優れた対話能力を持っています[2][3]。

結論

DeepSeek V3はコスト効率と広範な応用に優れたモデルであり、DeepSeek R1は特に推論能力と長文処理に特化したモデルです。両者は異なるニーズに応じて設計されており、利用者は目的に応じて選択することができます。
[1] 【遂にo1級登場】DeepseekR1に関して徹底解説します。o1よりも30倍近くAPIのコストが下がりAI開発がより進化しそう
[2] DeepSeek R1: Leading the New Era of Open-Source Language Models
[3] DeepSeek-R1 の概要|npaka
[4] DeepseekV3は何がすごいのか?何故ヤバいと言われているのかを解説
[5] DeepseekR1とは?O1級のパフォーマンスでコストは約1/30、MITライセンスでマジ強すぎます|まさお@未経験からプロまでAI活用

っていうか、feloさんのマークダウン形式コピペをここに貼り付けるといい感じに文字を装飾してくれるのね。

「いいね!」 2

DeepSeekを試してみました。

与えた質問文
Four points in space are given, not all in the same plane. How many planes can be drawn which are equidistant from these points?

スクロールバーを見ていただければわかるのですが、とんでもない長文が328秒かけて返ってきましたw

解答の答えは合っているのですが、肝心の論述のほうは少々不十分で、

↑こんな感じで、一般のTetrahedronについて自説を立証できないまま解答を出してきます。証明としては弱いですね。

↑すごい序盤のほうでこんな感じに『平面の片側にある点の数』という重要な条件を見出しそうだったのですが、そのまま議論は別の方向へ。

見た感じ、GPTより時間当たりの思考力は弱そうです。しかし、無料ユーザーにもすさまじい思考時間を割り当ててくれるので、ちょっと難しい問題でも解答はちゃんとくれます。

この思考時間はちょっとうれしいですね。ここまでしてくれるならまあGPTより良い場面もあるかな。
これからもし有料化したらゴミですねたぶん。その場合はGPTに課金した方がいいでしょう。

「いいね!」 1

DeepSeek R1じゃない普通のバージョンで『ドラゴンクエスト3でバラモスを倒すにはどうする?』と訊きました。

間違いだらけでひどいですね。中国のAIだからネット上のいろんなサイトを参照してくれると思っていましたが、ポリシーはOpenAIと大して変わっていないようです。
ネット上からの情報を提示してくれるのはやはりCopilotで、今回のような質問ではGPTもDeepSeekも使い物になりません。
まあ、手動で見るほうがいいのかなこういうのは。