AI– category –
-
AI
GPT-4o(Vision)を活用したOCRツールの進化:OCRから翻訳、画像解説まで
前回紹介したGPT-4o Visionを使用したOCRツールをさらに発展させ、より包括的な画像処理・理解ツールへと進化させました。 https://bhrtaym-blog.com/?p=617 新バージョンでは、テキスト抽出に加えて翻訳、要約機能、そして画像解説機能を実装し、より幅広... -
AI
【実装例】GPT-4o Vision APIで作る高精度OCRツール|手書き文字認識の新時代
なぜGPT-4 VisionベースのOCRツールが必要だったのか ビジネスシーンでは、手書きのメモやドキュメントをデジタル化する需要が依然として高く存在します。従来のOCRツールでは、特にTesseractのような無料のオープンソースソリューションでは、期待する精... -
AI
OpenAI Swarm実践ガイド:AIエージェントの具体的な実装方法
前回の記事では、OpenAI Swarmの基本概念と可能性について解説しました。 https://bhrtaym-blog.com/?p=553 前回Swarm解説記事 今回は、実際のコード実装を通じて、具体的な活用方法をご紹介します。AIフロンティアでは、このたびGitHubにWikipedia分析用... -
AI
Docker Composeで簡単にAnthropic Computer Useデモ環境の構築方法
皆さん、AIの可能性を広げるデモ環境の構築はもう試されましたか? 前回の記事では、Anthropic Computer Useについて紹介しましたが、GitHubのページにはDockerコマンドを使った設定方法のみが記載されており、APIキーを毎回入力する必要があったり、何度... -
AI
Anthropic Computer Use機能がもたらすAIとコンピューター操作の革新
AIの進化が加速する中、Anthropic社が画期的な新機能「Computer Use」を発表しました。この機能により、AIが人間のようにコンピューターを直接操作できるようになり、業務自動化のさらなる進化が見えてきています。 数年前にはRPAがブームでしたが、生成AI... -
AI
WindowsからMacへ – BitNetの動作確認奮闘記
AIの世界に革命を起こす可能性を秘めた技術、それがMicrosoftの「BitNet」です。従来の16ビットモデルと同等の性能をわずか1.58ビットで実現するこの画期的なアーキテクチャは、AI開発者やエンジニアの間で大きな注目を集めています。 しかし、新しい技術... -
AI
OpenAI Swarm:ビジネス革新を加速させる次世代AIコラボレーション
こんにちは、今回は、OpenAIが開発した革新的なフレームワーク「Swarm」について解説します。 この技術が、私たちのビジネスにどのような変革をもたらすのか、一緒に探っていきましょう。 1. Swarm: ビジネスのための新しいAIパラダイム なぜSwarmに注目す... -
AI
Ollamaで体験!Gemma2-2b-jpnが切り拓く日本語AI活用の新時代
はじめに 前回の記事では、Googleが発表した日本語版Gemma2:2Bの概要について紹介しました。 今回は、このモデルを実際にOllamaを使って動かし、元のGemma2:2bとの比較を通じてその性能と実用性を検証した結果をお伝えします。 また、今回動作確認している... -
AI
Google、日本語AIの新時代を切り拓く – Gemma 2 2Bが登場
Googleは10月3日に東京で開催されたGemma Developer Dayにて、日本語版Gemma 2 2Bを公開しました。この最新モデルは、従来のGemma 2に比べて大幅に品質が向上し、特に文章生成能力と指示の理解に優れています。 Gemma 2 2Bの主要特徴 Gemma 2 2Bの主な特徴... -
AI
ChatGPTで業務効率を劇的にアップ!5つの活用法と具体的プロンプト
「AIを使いこなせば、もう時間に追われることはない」 業務効率化のキーワードとして注目を集めるChatGPT。あなたはその真の実力を知っていますか? 本記事では、ビジネスパーソン必見のChatGPT活用法5選と、そのまま使える具体的なプロンプトを大公開!明...
12