CHEMINFO Title Bar

Hledání informací o chemické sloučenině  (hledání podle chemického názvu a vzorce)

CI obsah přednášky
Poslední změna: 14.4.1998 

I. Úvod

Hledání informací o chemické sloučenině můžete začít se jménem sloučeniny, jejím vzorcem, nebo s různými jinými slovy nebo kódy které mohou být s touto sloučeninou spojovány. (Viz: Locating All CA File References Citing a Chemical Substance. a How to Search for CAS Registry Numbers in the CAS Registry File.) V této lekci si všimneme různých kódovacích systémů, které byly použity pro vyhledávání chemických sloučenin jak  v tištěných tak počítačových zdrojích.
 

II. Hledání sloučeniny za pomoci CAS registračního čísla

Použití CAS registračního čísla (REGISTRY NUMBER) pro vyhledání informací o chemické sloučenině je velmi účinná metoda. Registrační číslo je unikátní číslo přiřazené každé sloučenině indexované v CAS. Registrační číslo se užívá při indexování záznamů CA databáze místo formálního názvu sloučeniny. (Viz STN LCA record displayed in the ALL format.) CAS RN je číslo ve formátu Y-XX-X, kde Y může být od dvou do šesti číslic, a X je jedna číslice, např.: 494-12-2. Registrační číslo se používá v mnoha databázích a stále více jako index v tištěných referenčních pracích.

III. Index Guide a tištěný Chemical Substance Indexes

Právě tak jako Index Guide určuje slovník, který musí být používán v Chemical Abstracts General Subject Index, poskytuje také správná jména, která se mají používat při hledání v CA Chemical Substance Index. Např. pod heslem "Flavan" v najdeme v  Index Guide následující:

Flavan
See 2H-1-Benzopyran, 3,4-dihydro-2-phenyl- [494-12-2]

Při zařazování jmen chemických sloučenin podle abecedy do indexu jsou lokantová čísla, stereochemické označení apod. ignorovány. Takže abychom nalezli tuto sloučeninu, musíme hledat v sekci "B" tištěného CA Chemical Substance Index  "Benzopyran". Všimněte si, že CAS indexové jméno pro Flavan je invertováno, se jménem tzv. HEADING PARENT uvedeným jako prvním. Toho se používá proto, aby strukturně příbuzné sloučeniny byly ve stejné oblasti v indexu. Základní sloučenina - Heading Parent - je uvedena první a je následována svými deriváty a jinými strukturně příbuznými sloučeninami.

IV. Sloučeniny s kvalifikátory v CAS databázích a indexech

  • Pokud během indexačního období nebylo o sloučenině mnoho napsáno, pak veškeré informace jsou uvedeny najednou v abecedním pořadí pod jedním indexovým jménem (Index Name) v tištěných Chemical Substance Index. Pokud ale počet záznamů pro jeden indexový název (sloučeninu) je příliš velký, CAS je pak rozdělí do standardních subjektových oddílů (Standard Subject Divisions). Sloučeninám, pro které se toto dělení provádí se říká QUALIFIED SUBSTANCES (sloučeniny s kvalifikátory). Původně se používalo sedm kvalifikátorů ale v roce 1994 byly přidány další dva termíny (formation, processes) a jedna fráze byla nedávno rozdělena na dvě (uses, miscellaneous). Používané kvalifikátory jsou:
  • Při online vyhledávání je důležité používat CAS standardní zkratky a akronymy, protože použití zkratek je dávána v online záznamech přednost před plnými terminy, tím pádem i v Basic Index CA databáze.

    V. CAS úlohy v CA a jiných databázích

    Úlohy (ROLES) jsou CAS indexové termíny přiřazené každé indexované sloučenině a ke kontrolovaným indexovaným termínům pro třídy sloučenin. Úlohy začaly být používány u nových záznamů v CA databázi od svazku 121 (červenec 1994). Úlohy byly potom zpětně použity na všechny CA záznamy pomocí počítačového programu.. Díky tomu, že existuje 38 specifických úloh a 7 širokých super úloh (super roles), podstatně se rozmnožily indexové termíny oproti dříve používaným. Úlohové termíny dávají přesnější vazbu ke sloučenině. Např. teď je možné specifikovat nejen že chcete přípravu sloučeniny ale také že to má být syntetická příprava a ne průmyslová výroba. V minulosti nebyly tyto dvě metody rozlišovány a používal se jednotný termín "připrava" ("Preparation"). Nicméně je stále možné hledat v CA databázi pro všechny způsoby přípravy sloučeniny nebo skupiny sloučenin, které lze nalézt v Registry File přidáním "/P" k číslu sady odpovědí z Registry File (nebo pro jednu sloučeninum přidáním "P" přímo k Registry Number při hledání v CA databázi), např:

    => SEARCH L2/P (kde L2 je sada odpovědí z prohledávání Registry File)

    nebo

    => SEARCH 494-12-2P

    Úlohy (roles) musí být připojeny k L# sadě odpovědí vytvořené v Registry File pokud byly použity ve spojení s touto sadou L# k prohledávání CA databáze. Příklad použití kódu úlohy "SPN" (Synthetic Preparation) je:

    => FILE REGISTRY
    => S FULLERENE/CNS

    L2 3287 FULLERENE/CNS

    CNS je označení pro pole segmentů chemického jména (chemical name segment) na STN.

    => FILE CA

    => S L2/SPN OR FULLERENES/SPN 5347 L2 35422 SPN/RL 206 L2/SPN (L2 (L) SPN/RL) 1759 FULLERENES/CT 35422 SPN/RL 108 FULLERENES/SPN (FULLERENES/CT (L) SPN/RL) L3 248 L2/SPN OR FULLERENES/SPN

    Úlohy lze prohlížet v online thesauru a zjistit tak hierarchie a definice úloh. V současnosti jsou úlohy používány v databázích CA, CAplus, CASREACT a MARPAT.

    VI. Prohledávání Registry File podle chemického jména

    Registry File je největší existující zdroj chemických jmen. Může být prohledáván podle komerčního nebo běžného jména sloučeniny (CN), podle  CAS Index Name (CN) sloučeniny nebo podle fragmentů CAS Index Name (CNS pole). (Viz: Tips for Chemical Name Searching.) Basic Index v Registry File zahrnuje jak fragmenty chemického jména tak fragmenty vzorce molekuly. Někdy je nutné používat jisté postupy při použití speciálních znaků aby bylo možné vyhledávat podle chemické jména. Např. řecká písmena se píší plným jménem s tečkou před a za řeckou částí jména. Příklady vyhledávání podle chemického jména v  Complete Chemical Name Index (/CN) nebo v Chemical Name Segment Index (/CNS) v Registry File:

    => SEARCH ISATIN/CN

    => SEARCH .ALPHA.-METHYLBENZOIN/CN

    => SEARCH ACETYLSALICYLIC ACID/CN

    => SEARCH IMINO/CNS

    Vzhledem k tomu, že za hledání v Registry File se platí, je nejlepší nejprve zkontrolovat jméno expandováním v příslušném indexu. Často je v případech, kdy sumární vzorec (molecular formula) má mnoho isomerů, efektivní cesta k vyhledání sloučeniny kombinace vyhledání podle sumárního vzorce a vyhledání v Chemical Name Segment..

    VII. Hledání v Registry File a tištěných CA Indexes podle vzorce

    Nejčastěji používaným systémem, který je dnes používán pro řazení vzorců v indexech je Hillův systém
    (HILL SYSTEM). Hillův systém zahrnuje jak organické tak anorganické sloučeniny podle následujících pravidel:
    1. Sečtěte zvlášť všechny stejné atomy v molekule
    2. Pokud je přítomen uhlík, umístěte ho spolu s číslem udávajícím celkový počet C na začátek vzorce
    3. Pokud je přítomen jak uhlík tak vodík, umístěte H a číslo udávající jejich počet jako druhé. Pozor, pokud uhlík není přítomen, platí pro tuto sloučeninum pravidlo 4 a H je umístěn podle abecedy
    4. Všechny ostatní atomy jsou řazeny abecedně. To znamená, že u anorganických sloučenin bez uhlíku je řazení abecední.
    V samotném indexu hrají úlohu i čísla udávající počet prvků v molekule. Zde je příklad sloučenin seřazených podle Hillova indexovacího systému:
    Al6 Ca5 O14
    B2 O3
    B2 Zr3
    Br H
    C Cl4
    C H Cl3
    C H N O
    C2 Ca
    C2 H4
    C2 H4 Br Cl
    C2 H5 Al Br2
    C5 H8 O2
    C8 H5 N O2
    C15 H24 N2
    C22 H24 F N3 O2
    Ca O3 Ti
    Cl H
    H2 O4 S
    H4 Sn
    O3 Pb Rb2
    O5 P14 Zn7
    Sn Zr4

    V Registry File mohou být vzorce vyhledávány jak s mezerami mezi symboly prvků tak bez nich. Mezery lze vkládat pro přehlednost. Podle Hillova systému lze dostat vzorce, které jsou zcela odlišné od těch, které jsou běžně chemiky používány, např.: H2O4S nebo BrH.

    Tištěné CA Formula Indexes neobsahují záznamy pro asi 600 sloučenin s kvalifikátory, o kterých je mnoho informací v daném indexačním období. Tak najdeme např. v CA Formula Index pro období 10tého kolektivního indexu (Collective Index) (1977-81):

    C8H5NO2
    1H-Indole-2,3-dione [91-56-5].

    Pro nalezení podrobných informací o isatinu tak musíte použít tištěný Chemical Substance Index. Záznamy v tomto indexu obsahují "textové modifikace" (TEXT MODIFICATIONS), které dávají více informací o indexovaných dokumentech.

    Mějte na paměti, že chemickému vzorci v Hillově systému může odpovídat více než jedna slouženina. Pro daný vzorec jsou isomery seřazeny podle abecedy podle CAS Index Name.

    V online indexu vzorců (molecular formula index) v Registry File (/MF), sole, adiční sloučeniny a směsi mají molekulové vzorce komponent uvedeny odděleně, spolu s poměry pro soli a adiční sloučeniny (pokud jsou známy). Pokud poměry nejsou známy, používá se před druhým vzorcem písmeno "x", např.:

    C15 H24 N2.2Cl H

     C22 H24 F N3 O2.xH2 O4 S

    To jsou příklady tzv. DOT-DISCONNECTED FORMULAS (tečkou rozdělených vzorců). Jak už bylo uvedeno dříve u hledání podle jména sloučeniny, je nejlepší expandovat vzorec molekuly v MF indexu před online vyhledáváním. (Viz: Tips for Molecular Formula Searching.)

    VIII. Databáze CAOLD

    Databáze CAOLD obsahuje záznamy pro dokumenty indexované Chemical Abstracts v letech 1957-66. Je možné prohledávat CAOLD pouze s CAS Registry Number. Záznamy pro položky v CAOLD jsou jen velmi málo podobné záznamům v CA databázi. Poskytují pouze odkaz do tištěných Chemical Abstracts. pomocí přístupových čísel.  Je důležité vědět, že záznamy v CAOLD byly generovány z CA Formula Indexes. Díky tomu, že sloučeniny s kvalifikátory nemají záznamy ve Formula Index, existuje mnoho CA přístupových čísel  v období 1957-66, které nemají odkazy z CAOLD databáze. Je vždy nejlepší zkontrolovat výsledky z vyhledávání v CAOLD v tištěném Collective Index.

    IX. Jiné způsoby prohledávání Registry File.

    Existuje několik dalších indexů, které lze použít při online vyhledávání v Registry File, např.:

    Compound Class Identifiers (/CI) Př.: => SEARCH PMS/CI (vyhledá polymery)

    Periodic Group Codes (/PG) Př.: => SEARCH LNTH/PG (vyhledá molekulové vzorce s lanthanoidy)

    Taková vyhledávání lze použít v kombinaci s jinými ke zúžení sady odpovědí. Viz Registry File Summary Sheet pro další možnosti.

    X. Ring Indexes

    Ring Systems Handbook poskytuje snadný způsob k nalezení "Heading Parent"  - základu jména cyklických sloučenin. Toto jméno pak může být použito v tištěném Chemical Substance Index, nebo při online vyhledávání, buď jméno nebo Registry Number může byt použito k vyhledání záznamu v Registry File. Přístup k záznamům v Ring Systems Handbook je podle jména nebo analýzy kruhu (a pak podle molekulového vzorce kruhů, jež tvoří sloučeninu). Hlavní část sady je uspořádána podle počtu kruhů tvořících sloučeninu a jednotlivých velikostí nejmenších kruhů. Počet kruhů, velikost těchto kruhů a elementární složení těchto kruhů poskytuje dostatek informací k nalezení kruhu. Sekce v hlavní části této práce může být označena:



    Nalezli bychom v této sekci záznam pro 1H-Indole [120-72-9]
                             H
                   C         .
                 :   .     . N .
               C:      .C.      . C
               .        :         :
               .        :         :
               C:       C.........C
                 :    .            
                   :C.
    s molekulovým vzorcem C8H7N a s 2-dimensionálním strukturním vzorcem.

    Chemical Abstracts obsahují Index of Ring Systems s každým Formula Index, počínaje obdobím 7. kolektivního indexu (1962-66). Registry File nyní má mnoho informací o kruzích, které lze vyhledat online, jako je  Elemental Sequence for the Smallest Ring (/ESS) (pořadí prvků v nejmenším kruhu),  number of rings in the ring system (/NRRS) (počet kruhů v kruhovém systému), atd. Tyto vyhledávácí techniky mohou pomoci při zužování odpovědí při vyhledávání v sloučenin Registry File.

    XI. Jiné online databáze chemických sloučenin

    Databáze typu Registry File se označují jako ONLINE CHEMICAL DICTIONARY FILES. Pomáhají při indetifikaci sloučenin, ke shromažďování podobných sloučenin do sady,  a ke zjištování, které databáze u daného dodavatele obsahují informace o sloučenině.

    Obzvláště zajímavé jsou databáze chemických sloučenin od National Library of Medicine. Nejsou zdaleka tak obsáhlé jako Registry File, CHEMLINE obsahoval přes 1,360,000 záznamů v r.1995. CAS Registry Number je součástí každého záznamu. Je možné hledání podle CAS RN, molekulového vzorce, CAS Index Name, synonym, různých fragmentů názvu a struktury. Menší databáze od NLM je ChemID, jež obsahuje asi 300,000 sloučenin. Důležitým rysem ChemID databáze je existence SUPERLISTu. SUPERLIST je sbírka seznamů chemických sloučenin udržovaných klíčovými vládními kontrolními agenturami, právě tak jako vědeckými organizacemi, jež se zabývají vlivem chemických sloučenin na zdraví a životní prostředí. ChemID poskytuje pomoc při hledání těchto seznamů. Prohledávání NLM databází je podstatně levnější než prohledávání CAS Registry file. To platí specielně pro ChemID databázi.

    XII. Jiné zdroje.

    Zde jsou odkazy na tištěné a Internetové zdroje, jež se týkají tohoto tématu.

    Search REGISTRY the world's fastest growing authority database on chemical substance information

    Using The CAS Registry File on STN