有価証券報告書の次世代タクソノミはそろそろ真剣に次世代を考えて欲しい

前回、「上場企業の有価証券報告書に対してモノ申したいこと」として、有価証券報告書にミスが含まれたまま開示されることがある点について書きましたが、言いたいこととしては実は今回が本丸となります。

blog.boost-up.net

今回はXBRLの中身に少しだけ入り込んでテクニカルな話をします。

XBRL版の有価証券報告書

有価証券報告書はPDF版とXBRL版の2種類が開示されており、 人が読む場合はPDF版、システムが処理する場合はXBRL版を使います。

XBRLというのは、eXtensible Business Reporting Languageの略称であり、事業報告のため標準化されたXMLベースの言語です。

その昔、有価証券報告書をはじめとする各種の開示書類は紙で提出されていました。 その後、PDF化されたファイルがインターネット経由で開示されるようになったものの、 PDFは(一定のテキスト検索はでいるとは言っても)テキストを画像化したファイルに過ぎず、 投資家が多くの企業の開示情報を処理するためには一つ一つ人間が読み込む必要がありました。

これでは折角IT化したのにやっていることは昔と変わらない、もっと効率的に処理する方法はないか、ということで発明されたのがXBRLになります。

XBRLはXMLベースの言語ですので、情報に対して自由にタグ付けして意味を持たせることが出来ます。 ただ、各企業が自由にタグ付けして開示したのではそれを受け取った投資家は結局各社のルールを理解して読み込まなければならなくなりますので、このタグ付けを標準化することで、企業間の比較可能性を確保しようとしたルールの一つがEdinetタクソノミという関係になります。

XBRLのイメージ

例えば、ユーグレナの最新事業年度の連結売上高を「主要な経営指標等の推移」で見ると、PDFでは次のように表示されています。

※赤枠は加工です。 f:id:boost-up:20180711083956p:plain

これをXBRLで見ると次のように表現されます。

※赤枠は加工です。 f:id:boost-up:20180711084153p:plain

「jpcrp_cor:NetSalesSummaryOfBusinessResults」が主要な経営指標等の推移における(連結)売上高を示すコードで、 「CurrentYearDuration」が最新の事業年度を示し、通貨は「JPY」、decimals="-3"は千円単位で表示することを意味します。 そして、タグに囲まれた値「13886603000」が値です。

これならXMLを扱う技術があればシステム的に処理できますね。

Edinetタクソノミの課題① タグ付けが不十分

先ほどの連結売上高はわかりやすいのですが、 次に、上場企業サーチで拾い集めている「平均年間給与」という情報を見てみましょう。

PDFではこの辺です。 f:id:boost-up:20180711085211p:plain

次に、XBRLを示します。 f:id:boost-up:20180711085256p:plain

。。。あれ、タグがない?

現在のEdinetは全文XBRLを売りにしているものの、実は財務諸表や経営指標等など一部の計数情報以外はテキストブロック要素と呼ばれる文書のかたまり全体をタグ付けする形が採用されており、タグの中にはHTMLが記述されています。

実際に、100行ほど上に行くと、下のようなタグがあります。 f:id:boost-up:20180711085859p:plain

要するに、5【従業員の状況】全体が「jpcrp_cor:InformationAboutEmployeesTextBlock」というテキストブロックとなっており、 ここから平均年間給与の情報を機械的に取得したいときには、利用者が要素内のHTMLを解析して文字列として取得しなければならないのです。

しかも、要素内のHTMLの記述は統一されておらず、はっきり言って100社あったら100通りの記述がされているのです。

数年前、初めてこの仕様を知ったときは愕然としました。

平均年間給与に関して言えば、ほぼ100%の企業が表で表現していますが、 ヘッダー行数、列数がバラバラであるうえに金額単位もバラバラ、挙句前回指摘したように表記されている金額単位と実際の金額が一致していないミスが存在する状況です。 表が行結合されていたりすると一層解析が面倒になります。

果たしてこれが利用者のことを考えた仕様と言えるでしょうか。

Edinetタクソノミの課題② 日本基準以外は標準化ができていない

EdinetにおけるXBRLの利用は、元々財務諸表から始まった経緯があり、以前は5【従業員の状況】などはXBRL化の対象ではありませんでした。 ところがここ数年、本丸である財務諸表に対するXBRLの適用について、大きな問題が起きています(少なくとも個人的には大問題だと思っています)。

XBRL化は標準化が前提となるため、例えば「売上高」や「現金」といった勘定科目に対して、原則として一意のタグを定義しなければなりません。 本来はそれを標準化するのがEdinetタクソノミのはずなのですが、実はEdinetタクソノミは未だ、事実上日本基準にしか対応していません。

以下は、金融庁 総務企画局 企業開示課が作成している平成29年2月版の「提出者別タクソノミ作成ガイドライン」の抜粋(赤線は加工)です。

f:id:boost-up:20180713082358p:plain

赤線箇所を見ると、IFRSの詳細タグ付けは任意です。米国基準の詳細タグ付けはしない、と書かれています。 これが意味するところは以下の通りです。

例えば、上場企業の「のれん」の実態を調査する場合、 日本基準を採用している上場企業の場合、例えばルネサステクノロジのXBRLをみると、以下のような情報を見つけることができます。

f:id:boost-up:20180713083318p:plain

「jppfs_cor:Goodwill」は日本基準での「のれん」を表します。この場合は17275000000(172億7,500万円)ということがわかります。

次に、IFRSを採用しているパナソニックのXBRLを見てみます。

f:id:boost-up:20180713084235p:plain

わかりますか? パナソニックの場合は、「のれん及び無形資産」としてグルーピングしており、 前期が”665,132”、今期が”738,251”がその金額になるのですが、データとしてみた場合、金額単位を特定することも困難です。 これが「詳細タグ付け」をしない場合の開示になります。

ちなみにこの例では「<jpcrp_cor:ConsolidatedStatementOfFinancialPositionIFRSTextBlock contextRef="CurrentYearDuration">」というタグで、IFRSに基づく連結財政状態計算書全体が一つのタグで括られています。

ハッキリ言って利用者からするとほぼ無価値です。これだったらPDF版を一社ずつ見ていった方が早いかもしれません。

Edinetタクソノミ、平成25年に「次世代Edinetタクソノミ」として導入されたのがこれです。 早くも次世代の登場を切に期待します。。。