プロンプトは超重要
前回までgoogleOCRとchatGPTのAPIを使用して、PDFファイルになった請求書から「請求書処理」に必要な情報をテキストとして取り出す仕組みについて、私が経験したことを共有しました。
多くの方が既にお気付きかと思いますが、これは別に請求書に限った話ではありません。「画像の中のテキストをそのテキストが持つ本来の意味を表わすものとして取り出す」ことができるようになったのです。
そして、個人的にはこっちの方が大事だと思いますが、私のような別にプログラミングを得意としない人間でも、このようなことができるようになるのです。
そうなのです。誰でもアイデアさえあれば画像から好きなようにテキストが取り出せるのです。今までは仮にテキストが取り出せても、そのテキストがどのような意味があるかは人が目で見て判断する必要があったことが、コンピュータが認識してその意味に該当するテキストを取り出せるようになったのです。
このことはあらゆる分野の業務に応用できるのではと考えられます。個人的にはシステムの入力が近い将来劇的に変わるのではないかと感じています。既に顔認証などのシステムが世の中に存在ししているわけですが、だれでもが「顔認証のような写真から入力データを自動取得する」仕組みができるんじゃないかと感じています。
ちょっと想像してみて下さい。対象物をスマホで写真を取ったらアプリが動いてその画像から必要なデータを取得し、別のアプリにそのデータを渡し…
という仕組みが誰でも作れる時代になったんです。
私の場合であれば、特に地方の中小企業ではいまだに納品書、請求書等の伝票から色々な社内帳票、売上管理、会計等のシステムへの入力に多大な労力を使っている場面を何度か目にしてきましたので、そのような単純労働を本当の意味でコンピュータに置き換えられる時代が来たのだと思っています。
この事は、今までこのような業務を行っていた人の仕事を奪うという議論がありますが、私は「とんでもない」と思っています。地方での人の減少は深刻でそれどころではない。特に医療での人海戦術など、地方では近い将来成り立たなくなるでしょう。
単純労働をコンピュータに任せることで、少ない職員、社員の力をより高度な事に向ける、あるいはこのような仕組みを作ることで事務処理はアウトソースしてしまうことで、会社は本業に人を割り当てるという形態に変えることで人口減でも生き残りを考えていく事が大切だと考えています。