Hledání informací o chemické sloučenině (hledání podle chemického
názvu a vzorce)
CI obsah přednášky
Poslední změna: 14.4.1998
I. Úvod
Hledání informací o chemické sloučenině můžete začít se jménem sloučeniny,
jejím vzorcem, nebo s různými jinými slovy nebo kódy které mohou být s
touto sloučeninou spojovány. (Viz: Locating
All CA File References Citing a Chemical Substance. a How
to Search for CAS Registry Numbers in the CAS Registry File.) V této
lekci si všimneme různých kódovacích systémů, které byly použity pro vyhledávání
chemických sloučenin jak v tištěných tak počítačových zdrojích.
Použití CAS registračního čísla (REGISTRY NUMBER) pro vyhledání informací
o chemické sloučenině je velmi účinná metoda. Registrační číslo je unikátní
číslo přiřazené každé sloučenině indexované v CAS. Registrační číslo se
užívá při indexování záznamů CA databáze místo formálního názvu sloučeniny.
(Viz STN LCA
record displayed in the ALL format.) CAS RN je číslo ve formátu Y-XX-X,
kde Y může být od dvou do šesti číslic, a X je jedna číslice, např.: 494-12-2.
Registrační
číslo se používá v mnoha databázích a stále více jako index v tištěných
referenčních pracích.
III. Index Guide a tištěný Chemical Substance Indexes
Právě tak jako Index Guide určuje slovník, který musí být používán v Chemical
Abstracts General Subject Index, poskytuje také správná jména, která
se mají používat při hledání v CA Chemical Substance Index. Např.
pod heslem "Flavan" v najdeme v Index Guide následující:
Flavan
See 2H-1-Benzopyran, 3,4-dihydro-2-phenyl- [494-12-2]
Při zařazování jmen chemických sloučenin podle abecedy do indexu jsou
lokantová čísla, stereochemické označení apod. ignorovány. Takže abychom
nalezli tuto sloučeninu, musíme hledat v sekci "B" tištěného CA
Chemical Substance Index "Benzopyran". Všimněte si, že CAS indexové
jméno pro Flavan je invertováno, se jménem tzv. HEADING PARENT uvedeným
jako prvním. Toho se používá proto, aby strukturně příbuzné sloučeniny
byly ve stejné oblasti v indexu. Základní sloučenina - Heading Parent -
je uvedena první a je následována svými deriváty a jinými strukturně příbuznými
sloučeninami.
IV. Sloučeniny s kvalifikátory v CAS databázích a indexech
Pokud během indexačního období nebylo o sloučenině mnoho napsáno, pak veškeré
informace jsou uvedeny najednou v abecedním pořadí pod jedním indexovým
jménem (Index Name) v tištěných Chemical Substance Index. Pokud ale počet
záznamů pro jeden indexový název (sloučeninu) je příliš velký, CAS je pak
rozdělí do standardních subjektových oddílů (Standard Subject Divisions).
Sloučeninám, pro které se toto dělení provádí se říká QUALIFIED
SUBSTANCES (sloučeniny s kvalifikátory). Původně se používalo sedm
kvalifikátorů ale v roce 1994 byly přidány další dva termíny (formation,
processes) a jedna fráze byla nedávno rozdělena na dvě (uses, miscellaneous).
Používané kvalifikátory jsou:
-
ANALYSIS (ANAL) - pro metodologii detekce nebo stanovení látky nebo její
analýzu; také pro separaci pokud záměr je analytický
-
BIOLOGICAL STUDIES (BIOL STUDY) - pro biochemické použití a pro procesy,
vlastnosti, výskyt a tvorbu v biologických systémech (včetně nefosilních
vedlejších produktů živé hmoty, potraviny, atd.). Studie použití materiálu
jako herbicidu, pesticidu a farmaka rovněž spadá do téhoto oddílu.
-
FORMATION (NONPREPARATIVE) - pro vznik látky v nepreparativně zaměřené
studii (od svazku 121 dále).
-
OCCURRENCE - pro přírodní výskyt (v jiných než biologických systémech)
-
PREPARATION (PREPN) - pro syntézu, výrobu, vznik (jiný než biochemický),
regenerace, separace a čištění
-
PROCESSES - pro operace s látkou, při kterých nedochází k reakci,
nepreparativní odstraňování látky a komplexní zpracování látky (od svazku
121 dále).
-
PROPERTIES (PROP) - pro fyzikální a chemické vlastnosti a příbuzné nereaktivní
procesy
-
REACTIONS - pro chemické změny, které vedou k produktům lišícím se chemicky
od výchozí látky, včetně jaderných interakcí, korozi, neutralizace, enolizace,
tautomerizace a jiné isomerizace.
-
USES AND MISCELLANEOUS - pro aplikace (jiné než biochemické), odstranění
(v čisticích procedurách), průmyslové zpracování, studie, které nelze jinak
klasifikovat. (Nyní jsou to dva různé kvalifikátory.)
Při online vyhledávání je důležité používat CAS
standardní zkratky a akronymy, protože použití zkratek je dávána v
online záznamech přednost před plnými terminy, tím pádem i v Basic Index
CA databáze.
V. CAS úlohy v CA a jiných databázích
Úlohy
(ROLES) jsou CAS indexové termíny přiřazené každé indexované sloučenině
a ke kontrolovaným indexovaným termínům pro třídy sloučenin. Úlohy začaly
být používány u nových záznamů v CA databázi od svazku 121 (červenec 1994).
Úlohy byly potom zpětně použity na všechny CA záznamy pomocí počítačového
programu.. Díky tomu, že existuje 38 specifických úloh a 7 širokých super
úloh (super roles), podstatně se rozmnožily indexové termíny oproti dříve
používaným. Úlohové termíny dávají přesnější vazbu ke sloučenině. Např.
teď je možné specifikovat nejen že chcete přípravu sloučeniny ale také
že to má být syntetická příprava a ne průmyslová výroba. V minulosti nebyly
tyto dvě metody rozlišovány a používal se jednotný termín "připrava" ("Preparation").
Nicméně je stále možné hledat v CA databázi pro všechny způsoby přípravy
sloučeniny nebo skupiny sloučenin, které lze nalézt v Registry File přidáním
"/P" k číslu sady odpovědí z Registry File (nebo pro jednu sloučeninum
přidáním "P" přímo k Registry Number při hledání v CA databázi), např:
=> SEARCH L2/P (kde L2 je sada odpovědí z prohledávání Registry File)
nebo
=> SEARCH 494-12-2P
Úlohy (roles) musí být připojeny k L# sadě odpovědí vytvořené v Registry
File pokud byly použity ve spojení s touto sadou L# k prohledávání CA databáze.
Příklad použití kódu úlohy "SPN" (Synthetic Preparation) je:
=> FILE REGISTRY
=> S FULLERENE/CNS
L2 3287 FULLERENE/CNS
CNS je označení pro pole segmentů chemického jména (chemical name
segment) na STN.
=> FILE CA
=> S L2/SPN OR FULLERENES/SPN 5347 L2 35422 SPN/RL 206 L2/SPN (L2 (L)
SPN/RL) 1759 FULLERENES/CT 35422 SPN/RL 108 FULLERENES/SPN (FULLERENES/CT
(L) SPN/RL) L3 248 L2/SPN OR FULLERENES/SPN
Úlohy lze prohlížet v online thesauru a zjistit tak hierarchie a definice
úloh. V současnosti jsou úlohy používány v databázích CA, CAplus, CASREACT
a MARPAT.
Registry File je největší existující zdroj chemických jmen. Může být prohledáván
podle komerčního nebo běžného jména sloučeniny (CN), podle CAS Index
Name (CN) sloučeniny nebo podle fragmentů
CAS Index Name (CNS pole). (Viz: Tips
for Chemical Name Searching.) Basic Index v Registry File zahrnuje
jak fragmenty chemického jména tak fragmenty vzorce molekuly. Někdy je
nutné používat jisté postupy při použití speciálních znaků aby bylo možné
vyhledávat podle chemické jména. Např. řecká písmena se píší plným jménem
s tečkou před a za řeckou částí jména. Příklady vyhledávání podle chemického
jména v Complete Chemical Name Index (/CN) nebo v Chemical Name Segment
Index (/CNS) v Registry File:
=> SEARCH ISATIN/CN
=> SEARCH .ALPHA.-METHYLBENZOIN/CN
=> SEARCH ACETYLSALICYLIC ACID/CN
=> SEARCH IMINO/CNS
Vzhledem k tomu, že za hledání v Registry File se platí, je nejlepší
nejprve zkontrolovat jméno expandováním v příslušném indexu. Často je v
případech, kdy sumární vzorec (molecular formula) má mnoho isomerů, efektivní
cesta k vyhledání sloučeniny kombinace vyhledání podle sumárního vzorce
a vyhledání v Chemical Name Segment..
Nejčastěji používaným systémem, který je dnes používán pro řazení vzorců
v indexech je Hillův systém
(HILL SYSTEM). Hillův systém zahrnuje jak organické tak anorganické
sloučeniny podle následujících pravidel:
-
Sečtěte zvlášť všechny stejné atomy v molekule
-
Pokud je přítomen uhlík, umístěte ho spolu s číslem udávajícím celkový
počet C na začátek vzorce
-
Pokud je přítomen jak uhlík tak vodík, umístěte H a číslo udávající jejich
počet jako druhé. Pozor, pokud uhlík není přítomen, platí pro tuto sloučeninum
pravidlo 4 a H je umístěn podle abecedy
-
Všechny ostatní atomy jsou řazeny abecedně. To znamená, že u anorganických
sloučenin bez uhlíku je řazení abecední.
V samotném indexu hrají úlohu i čísla udávající počet prvků v molekule.
Zde je příklad sloučenin seřazených podle Hillova indexovacího systému:
Al6 Ca5 O14
B2 O3
B2 Zr3
Br H
C Cl4
C H Cl3
C H N O
C2 Ca
C2 H4
C2 H4 Br Cl
C2 H5 Al Br2
C5 H8 O2
C8 H5 N O2
C15 H24 N2
C22 H24 F N3 O2
Ca O3 Ti
Cl H
H2 O4 S
H4 Sn
O3 Pb Rb2
O5 P14 Zn7
Sn Zr4
V Registry File mohou být vzorce vyhledávány jak s mezerami mezi symboly
prvků tak bez nich. Mezery lze vkládat pro přehlednost. Podle Hillova systému
lze dostat vzorce, které jsou zcela odlišné od těch, které jsou běžně chemiky
používány, např.: H2O4S nebo BrH.
Tištěné CA Formula Indexes neobsahují záznamy pro asi 600 sloučenin
s kvalifikátory, o kterých je mnoho informací v daném indexačním období.
Tak najdeme např. v CA Formula Index pro období 10tého kolektivního indexu
(Collective Index) (1977-81):
C8H5NO2
1H-Indole-2,3-dione [91-56-5].
See Chemical Substance Index
sodium salt [3486-31-5], 90: 6180p; 91: 157670v; 94: 209034z
Pro nalezení podrobných informací o isatinu tak musíte použít tištěný Chemical
Substance Index. Záznamy v tomto indexu obsahují "textové modifikace" (TEXT
MODIFICATIONS), které dávají více informací o indexovaných dokumentech.
Mějte na paměti, že chemickému vzorci v Hillově systému může odpovídat
více než jedna slouženina. Pro daný vzorec jsou isomery seřazeny podle
abecedy podle CAS Index Name.
V online indexu vzorců (molecular formula index) v Registry File (/MF),
sole,
adiční sloučeniny a směsi
mají molekulové vzorce komponent uvedeny odděleně, spolu s poměry pro soli
a adiční sloučeniny (pokud jsou známy). Pokud poměry nejsou známy, používá
se před druhým vzorcem písmeno "x", např.:
C15 H24 N2.2Cl H
C22 H24 F N3 O2.xH2 O4 S
To jsou příklady tzv. DOT-DISCONNECTED FORMULAS (tečkou rozdělených
vzorců). Jak už bylo uvedeno dříve u hledání podle jména sloučeniny,
je nejlepší expandovat vzorec molekuly v MF indexu před online vyhledáváním.
(Viz: Tips
for Molecular Formula Searching.)
VIII. Databáze CAOLD
Databáze CAOLD obsahuje záznamy pro dokumenty indexované Chemical Abstracts
v letech 1957-66. Je možné prohledávat CAOLD pouze s CAS Registry Number.
Záznamy pro položky v CAOLD jsou jen velmi málo podobné záznamům v CA databázi.
Poskytují pouze odkaz do tištěných Chemical Abstracts. pomocí přístupových
čísel. Je důležité vědět, že záznamy v CAOLD byly generovány z CA
Formula Indexes. Díky tomu, že sloučeniny s kvalifikátory nemají záznamy
ve Formula Index, existuje mnoho CA přístupových čísel v období 1957-66,
které nemají odkazy z CAOLD databáze. Je vždy nejlepší zkontrolovat výsledky
z vyhledávání v CAOLD v tištěném Collective Index.
IX. Jiné způsoby prohledávání Registry File.
Existuje několik dalších indexů, které lze použít při online vyhledávání
v Registry File, např.:
Compound
Class Identifiers (/CI) Př.: => SEARCH PMS/CI (vyhledá polymery)
Periodic Group Codes (/PG) Př.: => SEARCH LNTH/PG (vyhledá molekulové
vzorce s lanthanoidy)
Taková vyhledávání lze použít v kombinaci s jinými ke zúžení sady odpovědí.
Viz
Registry File Summary Sheet pro další možnosti.
X. Ring Indexes
Ring Systems Handbook poskytuje snadný způsob k nalezení "Heading
Parent" - základu jména cyklických sloučenin. Toto jméno pak může
být použito v tištěném Chemical Substance Index, nebo při online vyhledávání,
buď jméno nebo Registry Number může byt použito k vyhledání záznamu v Registry
File. Přístup k záznamům v Ring Systems Handbook je podle jména
nebo analýzy kruhu (a pak podle molekulového vzorce kruhů, jež tvoří sloučeninu).
Hlavní část sady je uspořádána podle počtu kruhů tvořících sloučeninu a
jednotlivých velikostí nejmenších kruhů. Počet kruhů, velikost těchto kruhů
a elementární složení těchto kruhů poskytuje dostatek informací k nalezení
kruhu. Sekce v hlavní části této práce může být označena:
Nalezli bychom v této sekci záznam pro 1H-Indole [120-72-9]
H
C .
: . . N .
C: .C. . C
. : :
. : :
C: C.........C
: .
:C.
s molekulovým vzorcem C8H7N a s 2-dimensionálním strukturním vzorcem.
Chemical Abstracts obsahují Index of Ring Systems s každým Formula
Index, počínaje obdobím 7. kolektivního indexu (1962-66). Registry File
nyní má mnoho informací o kruzích, které lze vyhledat online, jako je
Elemental Sequence for the Smallest Ring (/ESS) (pořadí prvků v nejmenším
kruhu), number of rings in the ring system (/NRRS) (počet kruhů v
kruhovém systému), atd. Tyto vyhledávácí techniky mohou pomoci při zužování
odpovědí při vyhledávání v sloučenin Registry File.
XI. Jiné online databáze chemických sloučenin
Databáze typu Registry File se označují jako ONLINE CHEMICAL DICTIONARY
FILES. Pomáhají při indetifikaci sloučenin, ke shromažďování podobných
sloučenin do sady, a ke zjištování, které databáze u daného dodavatele
obsahují informace o sloučenině.
Obzvláště zajímavé jsou databáze chemických sloučenin od National Library
of Medicine. Nejsou zdaleka tak obsáhlé jako Registry File, CHEMLINE obsahoval
přes 1,360,000 záznamů v r.1995. CAS Registry Number je součástí každého
záznamu. Je možné hledání podle CAS RN, molekulového vzorce, CAS Index
Name, synonym, různých fragmentů názvu a struktury. Menší databáze od NLM
je ChemID, jež obsahuje asi 300,000 sloučenin. Důležitým rysem ChemID databáze
je existence SUPERLISTu. SUPERLIST je sbírka seznamů chemických sloučenin
udržovaných klíčovými vládními kontrolními agenturami, právě tak jako vědeckými
organizacemi, jež se zabývají vlivem chemických sloučenin na zdraví a životní
prostředí. ChemID poskytuje pomoc při hledání těchto seznamů. Prohledávání
NLM databází je podstatně levnější než prohledávání CAS Registry file.
To platí specielně pro ChemID databázi.
XII. Jiné zdroje.
Zde jsou odkazy na tištěné
a Internetové
zdroje, jež se týkají tohoto tématu.
Search
REGISTRY the world's fastest growing authority database on chemical substance
information
Using The CAS Registry
File on STN