パトコアの技術ブログ

化学情報管理・創薬支援のためのケモインフォマティクス製品を扱うパトコアです。本ブログは技術チームにより運営されており、各種ツールを使うとどんなことができるの?という観点から、技術情報をお届けします。

パトコアの技術ブログ

化学構造式描画ツール

f:id:patcore:20201007190035p:plain

技術ブログ第一回目では、化学構造式描画ツールについて紹介します。

海外の方々とコミュニケーションをとる際には、言葉の壁が存在します。文化による表現の違いや、微妙なニュアンスの違いにより、苦労された経験がないでしょうか。 化学の世界では、幸いなことに化学構造という共通言語が存在するため、そのような心配は無用です。コーヒーの主成分であるカフェインを例にとると、慣用名であるCaffeine、IUPAC名である1,3,7-Trimethylpurine-2,6-dione、といった異なる表現はありますが、化学構造式を描画してしまえば意図する化合物についてきちんと伝えることができます。

その化学構造式を描画するツールとして、商用・OSS含めて様々な化学構造式描画ツールが存在しますが、ChemAxon社のMarvinは信頼性と機能性の点で他とは一線を画します。JavaベースのデスクトップアプリケーションであるMarvinSketchと、JavaScriptベースでWebアプリケーションに容易に組み込むことができるMarvinJSが提供されています。

MarvinJSが採用されているサービスの例

  • Elsevier Reaxys
  • EMBL-EBI ChEMBL Database
  • 製品評価技術基盤機構様 NITE-CHRIP
  • ナミキ商事様 ChemCupid

今回はMarvinSketchの実際の使い方を紹介します。


目次

Marvinの特徴

MarvinはChemAxon社の最初の製品とリリースされて以来、20年に渡って機能改善がなされてきました。以下の様な特徴があります。

  1. 個人利用、学術目的、非商用の利用は無償。1
  2. 素早い動作と洗練されたUI(スクリーンショット参照)。
  3. キーボードショートカット、周期表からの原素選択、2D/3D Cleanなどの多彩な機能。
  4. 官能基の登録や、表示メニューなどのカスタマイズが容易。
  5. ステレオケミストリー、SMARTS記法、Markush構造、ホモロジーグループ、アトムマッピング等、複雑な化学表記に対応。

f:id:patcore:20201007190040j:plain

使ってみる

MarvinSketchについて実際に何ができるのか、見ていきます。

MarvinSketchのインストーラはChemAxon社のページよりダウンロードすることができます。(注:ChemAxon社のサイトで会員登録が必要です。)

フォーマット

SMILES, MOL, SDF, PDB, InChI等の多彩なファイル形式を読み込むことができ、テキストのコピー&ペーストによる構造を貼り付けることができます2。他のエディタツールのファイル形式にも対応しており、ChemDrawの場合はCtrl+DによりXML形式でコピー⇒MarvinSketchに貼り付けることができます。

描画する構造のボンド長、太さ、フォント、色などは自由に変更できます。デフォルトで主要ジャーナルのガイドラインに沿ったフォーマットが登録されているため、論文投稿用の画像も簡単に用意できます。

f:id:patcore:20201007190026p:plain

キーボードショートカット

構造を描画するにあたって、キーボードをいかに効率的に使えるかが描画速度を上げる鍵となります。キーボードショートカットの説明については、ChemAxon社のユーザーガイド(MarvinSketchMarvinJS)をご覧ください。併せて、"Did You Know Series"として、Youtubeに使い方説明の動画がアップロードされています。

とりあえずは、以下を覚えておけば描くのがずいぶん早くなります。
※Windows環境での説明です。

  • 元素、分子略語
    キーボードで"o, cl, me, glu"などを入力すると、それぞれ酸素原子、塩素原子、メチル基、グルタミンとして認識されます。
  • 結合
    数字の"1, 2, 3"がそれぞれ単結合、二重結合、三重結合に対応しています。
  • 選択、削除
    Escキーで選択、Delキーで削除モードに切り替わります。
  • 置換
    Shiftキーを押下する・しないにより置換の様式が変わります。

物性・構造計算

Calculator Pluginsを使用することにより、pKa, logP, solubility, NMR, structural isomerなどのChemAxon社の物性計算を利用することができます。計算精度など詳細については、参考記事を参照下さい。

f:id:patcore:20201007190050p:plain

反応式

不対電子対の表示や、電子フローの矢印を使うことで反応を描画できます。反応の矢印を追加することで、反応物と生成物を自動で認識してくれます。下図では酸塩基平衡反応を描いてみました。

f:id:patcore:20201007190045p:plain

ちなみに、アトムマッピングという機能を使うと原子をマッピングするため、反応前後での原子を追うことができます。ChemAxon社にはAutoMapperというツールがあり、Marvin上で単にAtom mappingを選択することで自動で反応点を認識してくれます。

外部連携

MarvinSketchで描画した構造は、様々なフォーマットで保存できます。一方で標準で外部サイトと連携しているため、描画した構造を使って構造式検索を行うことができます。

f:id:patcore:20201007190031p:plain

  • Chemicalize
    ChemAxon社のChemoinformaticsサービスをオンラインで利用できる、クラウドプラットフォームです。
  • Reaxys
    Elsevier社の化学文献検索プラットフォーム
  • Google Patent
    最近、Google Patentでは化学情報(SMILES)により検索できるようになっています。MarvinSketchがSMILESに構造を変換することで特許情報を検索することができます。

生体高分子の描画

以上、低~中分子を念頭にMarvinの使い方を説明しました。

Marvinは20年近くに渡って多くの顧客に利用されており、低~中分子化合物の描画について様々な機能を有する、決定版といえるツールです。一方で、近年では創薬研究のテーマとして、低分子化合物だけではなく、核酸やペプチド、抗体薬物複合体といった新たなモダリティにも注目が集まっています。これら生体高分子ではそのモノマーの構造(アミノ酸、ヌクレオチド等)を略語で表し、シーケンス情報に基づいて化学情報が管理されます。さらに、天然の構造を化学的に修飾した特殊ペプチド、人工ヌクレオチドも使われるため、モノマーの構造を登録する機能も必要になります。

この様な生体高分子の描画について、Marvinでも一部対応していますが、より洗練された機能を持つ専用のツールとしてBioEddieという製品があります。生体高分子の記述言語であるHELMに対応しており、非天然の特殊ペプチドの登録機能等により、シーケンス・分子レベルでの正確な表現を可能にします。

BioEddieについてはまた別の投稿にて紹介したいと思います。Marvinについても、ポリマーや混合物の描画方法やクエリ構造の指定など、高級な機能がありますので、別な機会に記事にしてみます。


  1. ChemAxon社のサイトよりダウンロード下さい。
    https://chemaxon.com/products/marvin

  2. Name to Structureのライセンスにより、慣用名、IUPAC名、CAS登録番号等から構造へ変換することができます。日本語・中国語にも対応しています。
    https://chemaxon.com/products/chemical-name-conversion