PostgreSQL haldamine

Sissejuhatus

PostgreSQL andmebaasi haldamise eesmärgiks on tagada korrektselt tootav andmebaasiteenus, mida saavad kasutajad ja rakendused kasutada. PostgreSQL andmebaasi haldamine sisaldab sisaldab üldiselt selliseid tegevusi

Andmebaasi tarkvara paigaldamine süsteemi
Süsteemi paigaldatud andmebaasi tarkvara veaparanduste rakendamine
Süsteemi paigaldatud andmebaasi tarkvara versiooniuuenduste sooritamine
Andmabaasile kasutajate ja rakenduse jaoks ligipääsude tegemine
Andmebaasi vakumeerimine
Andmebaasist või selle osadest arhiivifaili moodustamine ja sellise arhiivifaili kasutamine
Andmebaasi varundamine ja taaste
Andmebaasi tarkvara eemaldamine süsteemist

Osa neist tegevustest on Kuutõrvajas käsitletetud eraldi tekstides.

Andmebaasi haldamise alla ei kuulu t andmebaasi kasutamisega seotud küsimused, kuigi tehniliselt võib saada kasutada samu instrumente nii kasutamise kui haldusprotseduuride soovitamiseks, nt programm psql.

Lisaks haldusprotseduuride endile kirjeldatakse käesolevas tekstis ka nt PostgreSQL andmebaasi objektide hierariat ja privileegisüsteemi, samuti, kuidas saada vastuseid haldamise seisukohalt olulistele küsimustele, nt milline on tabeli või andmebaasi suurus MBaitides.

Tööpõhimõte

commit kirjutab muudatuse wal logifaili
checkpoint kirjutab muudatused andmefailidesse

Vastaku ühe tabeli mingitele ridadele kolm 8k suurust page't base kataloogi all mingis failis; kui parasjagu baas nendega töötab, sh muudab, siis võiks nii öelda, et neist on olemas kolm eksemplari, kõik tõenäoliselt vähemalt mingitel hetkedel mingis osas erinevad üksteisest

base kataloogi alla nn data failides
shared buffers mälus
wal logi kataloogis failides

Andmebaasi mootori üks vastutus seisneb selles, et ta oma dirty, commit, checkpoint jt vahenditega töötab andmetega ja sedasi, et mis iganes hetkel võib juhtuda crash, ikkagi pärast seda kõige hullem, mis juhtub, et keritakse mingi hulk muudatusi tagasi, kuid andmed on siiski kooskõlalised.

Väited

autovacuum - tabeli ridadega toimunud update ja delete muudatused tekitavad tabelisse 'füüsiliselt' uusi sissekandeid, mille olemasolu on seotud PostgreSQL MVCC süsteemiga, st kui sama reaga tegeles üks kasutaja ja ütles delete, ning samal ajal teine kasutaja luges seda, siis peab baas suutma neid mõlemat kasutust teenindada; sellel põhjusel kogunevad ühest samast tabeli reast mitmed versioonid, autovacuum tegeleb vanade kasutute versioonide all oleva salvestusressursi uuesti kasutatavaks märkimisega; seejuurus autovacuum ei anna failisüsteemis mahtu tagasi v.a. siis kui tema vabastatavad read asuvad data failide lõpus
vacuum full - tabel kopeeritakse sisuliselt ümber ja ruum vabastatakse; ümber kopeerimiseks on vaja sama palju ruumi kui nö mustas tabelis on (st mitte pole vaja lisaks ainult seda ruumi, mis on reaalselt kasutuses); vacuum full saab öelda create database kaupa ja ka tabeli kaupa; vacuum full haldab automaatselt ära indeksid, constraintid jms

Haldustarkvara

Andmebaasi haldamiseks sobib kasutada nt selliseid programme

psql - nt sisaldub paketis postgresql-client-8.3
PgAdmin3

psql utiliidi kasutamine

psql on andmebaasi interaktiivne terminaliprogramm, mida saab üldiselt kasutada nii andmebaasi pärigute esitamiseks kui haldusprotseduuridele iseloomulike tegevuste sooritamiseks. Järgnevas kirjeldatakse psql kasutamist aktsendiga haldusele.

Skeemi tabelite nimekirja esitamine

SQL> \dt priiduskeem.*

ja koos suurustega lisada +

SQL> \dt+ priiduskeem.*

Väljundi faili salvestamiseks tuleb ette öelda

SQL> \o /tmp/psql-valjund.txt

Andmebaasid

Vaikimisi on kõigil PostgreSQL kasutajatel õigus ühenduda andmebaasiga, kusjuures sealt edasi andmebaasis sisalduvate objektide (skeemid, tabelid, vaated je) kasutamist piiratakse privileegidega. Kui andmebaas on ühe kasutaja oma ja skeem ning skeemis sisalduv teise kasutaja oma, siis esimene kasutaja ei pruugi saada teist skeemi kasutada vaatamata sellele, et ta on vastava andmebaasi omanik.

Skeemid

Võimaldada mitmetele kasutajatel kasutada sama andmebaasi säilitades kasutajate privaatsuse.
Korraldada andmebaasi objektid loogilistesse gruppidesse selleks, et andmebaas oleks paremini hallatav
Erinevates skeemides saab kasutada samu objektide nimesid

Skeemi moodustamiseks sobib öelda, tavaliselt tekitab nii süsteemi administraator oma kasutajatele skeeme

CREATE SCHEMA priiduskeem AUTHORIZATION priit;

kus

priiduskeem - tekitatava skeemi nimi
priit - andmebaasi kasutaja (üldisemalt roll)

Skeemide moodustamisel peab nimevalikul arvestama, et pg_ algusega nimede on reserveeritud kasutamiseks pg_catalog skeemis ning kuigi kasutajad saavad neid nimesid ka ise kasutada, kasutab andmebaas vaikimisi süsteemseid objekte kui sellise nimega pöörduda.

Kui andmebaasiga töötades skeemi mitte näidata, siis vaikimisi toimub tegevus

kasutajanimelises skeemis
kasutajanimelise skeemi puudumisel skeemis 'public'; see skeem moodustatakse andmebaasi loomisel automaatselt.

test=> show search_path;
  search_path   
----------------
 "$user",public
(1 row)

Skeemirada töötab sarnaselt tabelile ka muude skeemis sisalduvate objektidega, nt funktsioonid.

Skeemi suhtes on kasutajatel kahe sorti privileege

usage - skeemis sisalduvate objektide kasutamine
create - skeemi objektide tekitamine

Vaikimisi saavad kõik andmebaasi kasutajad töötada public skeemis, st seda kasutada ja sinna tekitada objekte.

Alati sisaldub andmebaasis nö süsteemne skeem pg_catalog ja seda kasutatakse enne skeemirajalt objektide otsimist.

public skeem on iseenesest tavaline skeem nagu iga teinega, nt võib selle vajadusel ka kustutada.

Skeemiraja seadistamiseks sobib öelda

set search_path to skeeminimi1, skeeminimi2

Skeemidele antud privileegide esitamiseks sobib öelda

baasinimi=# \dn+
                                     List of schemas
        Name        |  Owner   |  Access privileges   |           Description            
--------------------+----------+----------------------+----------------------------------
 information_schema | postgres | postgres=UC/postgres | 
                               : =U/postgres            
 pg_catalog         | postgres | postgres=UC/postgres | system catalog schema
                               : =U/postgres            
 pg_toast           | postgres |                      | reserved schema for TOAST tables
 pg_toast_temp_1    | postgres |                      | 
 public             | postgres | postgres=UC/postgres | standard public schema
                               : =U/postgres

kus

public skeemi omanik on kasutaja postgres ja tal on selle skeemi suhtes usage ja create õigused
kõigil teistel kasutajatel on public skeemi suhtes usage õigus; üldiselt võib öelda

kasutaja_kellele_privileeg_antakse=privileeg/kõnealuse_objekt_omaniku_nimi

PostgreSQL privileegisüsteem

PostgreSQL privileegisüsteem kontrollib, mida saavad erinevad kasutajad andmebaasis teha. Üldiselt on andmebaasi ligipääsule võimalik piiranguid seada kolmel tasemel

võrguühenduse tase - nt andmebaasi ees töötavas tulemüüris võrguühendusi src ipi aadressi täpsusega piirates
pg_hba.conf failis
andmebaasi sisemiste vahenditega

Andmebaasi sisemiste vahenditega saab ligipääse piirata kõige täpsemalt kusjuures seadistatud ligipääse hoib andmebaas selleks ettenähtud andmebaasi tabelites.

Kasutajad ja grupid - rollid

Üldiselt öeldakse, et PostgreSQLi andmebaasi kasutajad tegutsevad andmebaasi kasutades mingites rollides

andmebaasi objektide, nt tablitele juures on kirjas, millise rolliga kasutaja saab kõnealuse objektida millist tegevust sooritada, nt tabelit sisu select käsuga lugeda
andmebaasi sisselogimiseks on kasutajal vaja teada mõnda andmebaasis kirjeldatud LOGIN omadusega rolli ligipääse (sh parooli)
rollid võivad moodustada hierarhiaid, mida võib praktiliselt ette kujutada grupikuuluvustena; praktiliselt tähendab see nt seda, et andmebaasis kirjeldatakse roll ja sellega seostatakse mingid ligipääsud erinevatele objektidele ning selleks, et konkreetsed sisselogivad kasutajad saaksid kõnealustele objektidega tegevusi sooritada määratakse nad kirjeldatud rolli nö pärijateks

Rollid on kirjeldatud kogu andmeklustri ehk PostgreSQL installatsiooni eksemplari kohta, mitte iga andmebaasi kohta. Tuleb arvestada, et sama nö ühenduse sees saab kasutada ainult ühte andmebaasi, st nt ei saa sooritada päringut, mis tegelab erinevate baaside tabelitega.

Rollide moodustamine

Andmebaasi paigaldamisel tekitatakse andmebaasi selle kasutaja nimeline LOGIN omadusega roll, millena andmebaas paigaldati, traditsiooniliselt on selle rolli nimeks 'postgres'.

Group ehk mitte-LOGIN rolli moodustamiseks sobib öelda nt

SQL> create role kasutajad;

ja rolli eemaldamiseks

SQL> drop role kasutajad;

LOGIN rolli moodustamiseks sh parooli seadmiseks sobib öelda

SQL> create role priit login password 'parool' NOSUPERUSER INHERIT NOCREATEDB NOCREATEROLE;

Andmebaasi administraator saab muuta kõigi kasutajate paroole ja kasutaja saab muuta ise enda parooli öeldes

SQL> alter role priit with password 'uusparool';

Ilmutatud kujul parooli esitamisel on selline puudus, et see võib jääda kuhugi alles, nt logisse või .psql_history faili. Alternatiiviks on arvutada selliselt kokku ühendatud parool + kasutajanimi md5 summa

SQL> select md5('uusparoolpriit');
"fdd04c2f594e548b77c66781c8f5a85a"

ning seejärel, nb! hash algusse on lisatud 'md5'

SQL> alter role priit with encrypted password 'md5fdd04c2f594e548b77c66781c8f5a85a';

Rollide kasutamine

Käesoleva rollinime küsimiseks sobib öelda

SQL> select user;

Uue rolli omandamiseks sobib öelda

SQL> set role uusrollinimi;

Vaikerollile lülitumiseks

SQL> reset role;

Käesolevat rolli saab küsida

SQL> show role;

Kasutajale st login rollile grupi rolliga seotud privileegide lisamiseks

SQL> grant grupiroll to loginroll;

Rollidele andmebaasiobjektide kasutamise lubamine andmebaasi sisemise acl abil

Andmebaasi objektidel on privileegisüsteemi seisukohast kaks olulist omadust

objekti omanik (ingl. k. owner) - objekti moodustanud roll, kellel on objekti suhtes kõikvõimalikud õigused
pääsunimekiri (ingl. k. access control list, ACL) - millised omanikud saavad kõnealuse objektida milliseid tegevusi sooritada

Tabel

Olgu andmebaasi administraator tekitanud kaks rolli priit ning mart ning moodustanud kummagi kasutaja jaoks andmebaasi nendenimelise skeemi. Sellises olukorras saavad mõlemad kasutajad oma skeemis toimetada kuid üksteise tabelitele sisule ligi ei pääse.

test=> select * from priit.priidutabel;
ERROR:  permission denied for schema priit
LINE 1: select * from priit.priidutabel;

Selleks, et kasutaja mart pääseks lugema kasutaja priit tabeli priit.priidutabel sisu peab priit kõnealusele tabelile andma kasutajale mart select pääsu

GRANT SELECT ON TABLE priit.priidutabel TO mart;

Tabeli ligipääsude kohta saab küsida öeldes

test=> \z priit.priidutabel 
                               Access privileges
 Schema |    Name     | Type  |  Access privileges  | Column access privileges 
--------+-------------+-------+---------------------+--------------------------
 priit  | priidutabel | table | priit=arwdDxt/priit | 
                              : mart=r/priit          
(1 row)

kust on näha

priit=arwdDxt/priit - tabel kuulub kasutajale priit ning tal on omanikuna kõik privileegid
mart=r/priit - tabel kuulub kasutajale priit ning kasutajal mart on sellele r privileeg (select); üldiselt kehtib

kasutaja_kellele_privileeg_antakse=privileeg/kõnealuse_objekti_omaniku_nimi

Tabelilt ligipääsu eemaldamiseks sobib öelda

REVOKE select ON priit.priidutabel TO mart;

Tabelile saab ligipääse anda ka tulba täpsusega, nt

GRANT SELECT(nimi) ON priit.priidutabel TO mart;

kusjuures siis on võimalik küsida selectiga ainult vastava tulba andmeid.

Kasutaja parooli muutmine

ALTER USER kasutajanimi WITH PASSWORD 'parool';

Kõigi skeemi tabelitele rolli ligipääsu tekitamine, vastuseks saab hulga sql lauseid, mis tuleb seejärel käivitada, nt (\o /tmp/failinimi.sql salvestab vastuse failisüsteemi, et seda sealt \i /tmp/failinimi.sql abil seejärel kasutada)

SQL> \o /tmp/failinimi.sql
SQL> select 'GRANT SELECT, INSERT, UPDATE, DELETE ON ' || schemaname || '.' || tablename || ' TO rollinimi;' \
  from pg_tables where tableowner='omanikunimi' and schemaname != 'pg_catalog' and schemaname != 'information_schema';

Kusjuures, selleks, et roll saaks skeemi kasutada peab olema skeemile antud nt USAGE privileeg

SQL> GRANT USAGE ON SCHEMA skeeminimi TO rollinimi;

Tabelile ligipääs

SQL> SELECT 'GRANT SELECT ON skeeminimi.' || table_name || ' TO rakendus_ro;' FROM information_schema.tables WHERE table_schema = 'skeeminimi' \
  and table_type = 'BASE TABLE';
--------------------------------------------------------
GRANT SELECT ON skeeminimi.vahendaja TO rakendus_ro;
GRANT SELECT ON skeeminimi.oigus_antud TO rakendus_ro;
GRANT SELECT ON skeeminimi.dokumendi_fail TO rakendus_ro;
GRANT SELECT ON skeeminimi.vastuvotja_staatus TO rakendus_ro;
..

Sequentsidele ligipääs

SQL> select 'grant usage, select, update on rakendus.' || sequence_name || ' to rakendus_rw' FROM information_schema.sequences \
  where sequence_schema = 'skeeminimi';

                                 ?column?                                
------------------------------------------------------------------------
 grant usage, select, update on skeeminimi.sq_transport_id to rakendus_rw;
 grant usage, select, update on skeeminimi.sq_vastuvotja_id to rakendus_rw;
 grant usage, select, update on skeeminimi.sq_ametikoht_id to rakendus_rw;
 grant usage, select, update on skeeminimi.sq_ametikoht_taitmine_id to rakendus_rw;
 ..

Ligipääsu eemaldamine

SQL> SELECT 'REVOKE SELECT ON skeeminimi.' || table_name || ' FROM rakendus_rw;' FROM information_schema.tables WHERE table_schema = 'skeeminimi' \
  and table_type = 'BASE TABLE';

Funktsioon

ALTER FUNCTION vklog.log_dokument(vk.dokument, vk.dokument, character varying) OWNER TO vk_admin;

Trigger funktsioon

GRANT EXECUTE ON FUNCTION dkk.tr_allkiri_log() TO dkk_rw;

Rollidele andmebaasiobjektide kasutamise lubamine pg_hba.conf seadistusfaili abil

Seadistusfail /etc/postgresql/8.4/main/pg_hba.conf kontrollib ligipääsu sellise komplekti andmete alusel

ühenduse tüüp - üle tcp või unix soketi (st kas üle võrgu või unix soket abil)
baasi nimi
kasutaja nimi
ip aadress (tcp ühenduse puhul)
autentimise meetod - parooliga, kasutaja sertifikaadiga; unix soketi puhul ident

ident

Nn unixi postgre kasutaja saab ligi kõigile baasidele üle unixi soketi (/var/run/postgresql/.s.PGSQL.5432)

local   all         postgres                          ident

ja kasutamiseks tuleb öelda nt

# su - postgres
$ psql -U postgres

map

mappinguid juhitakse failiga pg_ident.conf http://www.postgresql.org/docs/8.4/static/auth-username-maps.html

# cat pg_ident.conf
..
# MAPNAME     SYSTEM-USERNAME    PG-USERNAME
mapping_yks   www-data        pg_kasutaja_1
mapping_kaks   www-data       pg_kasutaja_2

kus

MAPNAME - teisenduse nimi, mida pg_hba.conf failis kasutatakse
SYSTEM-USERNAME - ident nimi (kohalikust arvutist tehtud pöördumiste puhul praktiliselt andmebaasi poole pöörduva protsessi UID)
PG-USERNAME - andmebaasi kasutaja nimi, millena on vastaval SYSTEM-USERNAME'il lubatud andmebaasi kasutada

ja (kusjuures nagu ikka, oluline on kus ridade järjekorra mõttes antud rida paikneb nt tema ees ei tohi olla 'local all all reject')

# pg_hba.conf
local   all  all      ident map=mapping_yks

siis töötab nt selline kasutus

# su - www-data
$ psql -U pg_kasutaja_1 baasinimi
..
baasinimi =>

SQL arhiivifaili moodustamine

pg_dump programmi abil saab teha PostgreSQL andmebaasi (mitte kogu andmeklustrist, st kõigist andmebaasidest ühekorraga) andmetest erinevatel tasemetel koopiaid - andmebaasist, skeemist, tabelist, ja määrata seejuures täpsustusi, nt kas kopeeritakse ainult struktuur või struktuur koos andmetega. pg_dump kasutamise tulemusena moodustatakse arhiivifail.

Programmi kasumisel saab valida kolme formaadi vahel, milles väljund tekitatakse

tekst (ingl. k. plain) - tekstikujul SQL skript, vaikeformaat
kostümiseeritud arhiiv (ingl. k. custom) - binaarne ahriiv, vaikimisi pakitud, võimaldab kõige paindlikumalt pärast arhiivifailis olevaid andmeid kasutada
tar - TODO

pg_dump moodustab tänu MVCC tehnika kasutamisele andmetest kooskõlalise väljundi, nii nagu andmete seis oli pg_dump käivitamisel. Kuig pg_dump kasutamise ajal on nö tavapärane andmebaasi kasutamine võimalik, kasutab ta lukke selliselt, et nt samal ajal ei saab tabelite struktuuri muuta.

SQL skripti moodustamine

SQL skripti kujul esineva arhiivifaili moodustamiseks sobib öelda nt

 $ export PGPASSWORD=parool
 $ pg_dump -U postgres -h localhost baasinimi -f baasinimi-20090802.sql 
   1> baasinimi-20090802-1.log 2> baasinimi-20090802-2.log

Skripti tekitamisel saab määrata nt, kas skripti lisatakse käsud andmebaasi, skeemi või tabeli moodustamise kohta või mitte.

Kostümiseeritud arhiivifaili moodustamine

Nt andbaasi portaal skeemi data tabelist documents kostümiseeritud arhiivi moodustamiseks tuleb öelda

 $ export PGPASSWORD=parool
 $ pg_dump -Fc -h localhost -U postgres -t data.documents -f portaal.data.documents.fcdump portaal

SQL arhiivifaili kasutamine

Andmete taastamiseks on kaks programmi

psql - SQL skript antakse programmi sisendisse, psql täidab järjekorras seal esitatud laused kuni esimese veani või skripti lõpuni
pg_restore - programmi argumendina näidatakse kostümiseeritud SQL arhiivifail, väljundisse kirjutatakse lausete täitmisel esinevad vead, kuid töötatakse kuni arhiivifaili lõpuni

pg_restore võimaldab

taastada arhiivist andmeid objekti, nt tableli täpsusega
valida, millised järjekorras andmed arhiivist taastatakse

Kui andmebaasis on kasutatud contrib mooduleid, mille esmakordsel paigaldamisel tuli tõenäoliselt käivitavad vastav mooduli paigaldusskript (mis tekitas baasi funktsioone jms), siis taastel ei ole reeglina seda vaja kasutada, sest vastavad funktsioonid on baasis olemas ja taaste käigus nad tekitatakse.

SQL skripti kasutamine

Kasutamiseks tuleb psql utiliidiga laadida skript andmebaasi, nt

$ psql -U postgres -h localhost baasinimi < baasinimi-20090802.sql

Tekstikujul esituse puuduseks on suhteliselt mahtukas tulemus ja aeganõudev protseduuri kestus. Eeliseks võib pidada asjaolu, et andmed on inimesele hõlpsasti loetaval ja muudetaval kujul.

Kui esitada alltoodud käsk kujul, toimub skripti täitmine ühe transaktsioonina, mis praktiliselt tähendab seda, et kui skripti täitmine tehnilises mõttes ebaõnnestub, töötab andmebaas edasi muudatusele eelnenud kujul

$ psql -1 -U postgres -h localhost -f baasinimi-20090802.sql baasinimi

Kostümiseeritud arhiivifaili kasutamine

Andmete kopeerimiseks kostümiseeritud arhiivifailist otse andmebaasi sobib öelda nt

 $ pg_restore -d portaal -h localhost -U postgres portaal.data.documents.fcdump

Arhiivifailis sisalduvate objektide nimekirja esitamiseks tuleb kasutada -l võtit

 $ pg_restore -l /data/backup/dumps/portaal.data.dokuments.fcdump
 ;
 ; Archive created at Thu Sep 10 14:54:27 2009
 ;     dbname: portaal
 ;     TOC Entries: 11
 ;     Compression: -1
 ;     Dump Version: 1.10-0
 ;     Format: CUSTOM
 ;     Integer: 4 bytes
 ;     Offset: 8 bytes
 ;     Dumped from database version: 8.3.5
 ;     Dumped by pg_dump version: 8.3.5
 ;
 ;
 ; Selected TOC Entries:
 ;
 8462; 1259 40169 TABLE data documents sysadm
 9384; 0 0 ACL data documents sysadm
 8463; 1259 40175 SEQUENCE data documents_doc_id_seq sysadm
 9385; 0 0 SEQUENCE OWNED BY data documents_doc_id_seq sysadm
 9386; 0 0 SEQUENCE SET data documents_doc_id_seq sysadm
 9378; 2604 42053 DEFAULT data doc_id sysadm
 9381; 0 40169 TABLE DATA data documents sysadm
 9379; 1259 48086585 INDEX data documents_doc_id sysadm
 9380; 2620 48087091 TRIGGER data timestamp sysadm

kus

TOC (Table of Contents) - sisukord
rea alguses on objekti id väärtus
kõik semikoolonist paremale jääv on kommentaar

Nõuanded pg_restore kasutamiseks

Arhiivifaili sisu teisendamiseks SQL skripti kujule tuleb jätta ära -d võti

$ pg_restore arhiivifail-20100506.fcdump > arhiivifail-20100506.sql

Arhiivifaili ühte tabeli kirjelduse esitamiseks tuleb näidata skeemi ning tabeli nimi ja võti -s

$ pg_restore -s -n priiduskeem -t inimene arhiivifail-20100506.fcdump

Arhiivifailist ühe tabeli taastamiseks otse andmebaasi

$ pg_restore -d baasinimi -n priiduskeem -t inimene arhiivifail-20100506.fcdump

Arhiivifailist nimekirja alusel objektide taastamiseks tuleb esmalt -l väljundi alusel moodustada sobiva sisuga tekstifail ja seda redigeerida ning siis seda kasutada, seejuures võib ka objektide järjekorda muuta

$ pg_restore -l arhiivifail-20100506.fcdump > arhiivifail-20100506.fcdump.list
$ pg_restore -d baasinimi -h localhost -U postgres -L arhiivifail-20100506.fcdump.list arhiivifail-20100506.fcdump

Mitme protsessoriga arvutil saab -j võtme abil näidata milliselt määral kasutatakse paralleelset tööd andmete sisselugemisel, nt

$ pg_restore -j 16 -d baasinimi arhiivifail-20100506.fcdump

Globals

Globalsiks nimetatakse neid andmebaasi andmeid, mis ei sisaldu otseselt üheski baasis, vaid kuuluvad andmebaasi kui terviku juurde, nt rollid. Nende salvestamiseks sobib öelda

$ pg_dumpall -g -h localhost -U postgres > globals.sql

Moodustatud skripti sobib kasutada nagu nö tavalist sql skripti. Ainult rollide andmete kopeerimiseks sobib öelda

$ pg_dumpall -r -h localhost -U postgres > roles.sql

SQL dump/restore kasutamine arvestades objektide omanikke

Lähtepunkt

töötab üks PostgreSQL protsesside komplekt
on olemas üks andmebaasi tarkvara sisene kasutaja
on olemas create database andmebaas (kõik objektid kuuluvad mainitud kasutajale)

Sihtpunkt

töötab üks PostgreSQL protsesside komplekt
lähtepunktiks olnud kasutaja ja baas säilivad algsel kujul
on tekitatud juurde teine andmebaasi tarkvara sisene kasutaja
on tekitatud juurde teine create database andmebaas; kõik objektid on seal teise kasutaja omanduses
teise andmebaasi sisuks on esimese andmebaasi sisu
mõlemad create database andmebaasid on tavalised, üksteisest sõltumatud andmebaasid

Nt leiab selline ülesanne kasutust töötavast lahendusest teha koopia kõrvale mingite testimiste jaoks.

pg_dump -O ja psql

Protseduuri eeliseks on, et andmete sisselaadimine uude andmebaasi tõimub privilegeerimata kasutajana. pg_dump kasutamisel sql skript moodustamisel tuleb omanike käsud dump failist välja jätta kohe alguses

pg_dump -O ...

sisselaadimiseks

TODO

pg_dump -Fc ja pg_restore

Protseduuri eeliseks on, et andmete sisselaadimine uude andmebaasi tõimub privilegeerimata kasutajana. Moodustada -Fc dump

$ /usr/lib/postgresql/9.4/bin/pg_dump -Fc -f baasinimi-20180922-94.dump baasinimi

uue kasutaja moodustamine

postgres=# create role kasutajanimi login password 'fakeparool' NOSUPERUSER INHERIT NOCREATEDB NOCREATEROLE;

uue baasi moodustamine (template = template0 LC_COLLATE = 'C.UTF-8' LC_CTYPE = 'C.UTF-8' on näiteks)

postgres=# create database baasinimi owner = kasutajanimi template = template0 LC_COLLATE = 'C.UTF-8' LC_CTYPE = 'C.UTF-8';

Sisselaadimiseks sobib öelda

$ /usr/lib/postgresql/9.4/bin/pg_restore -d baasinimi -O -h 127.0.0.1 -U kasutajanimi baasinimi-20180922-94.dump
Password:
pg_restore: [archiver (db)] Error while PROCESSING TOC:
pg_restore: [archiver (db)] Error from TOC entry 8746; 0 0 COMMENT EXTENSION plpgsql
pg_restore: [archiver (db)] could not execute query: ERROR:  must be owner of extension plpgsql
    Command was: COMMENT ON EXTENSION plpgsql IS 'PL/pgSQL procedural language';
 
pg_restore: WARNING:  no privileges could be revoked for "public"
pg_restore: WARNING:  no privileges could be revoked for "public"
pg_restore: WARNING:  no privileges were granted for "public"
pg_restore: WARNING:  no privileges were granted for "public"
WARNING: errors ignored on restore: 1

kus

-O kasutada ilma owner käskudeta
- tõneäoliselt saab mõned praktiliselt ebaolulised vead/hoiatused

reassing

Protseduuri puhul toimub andmete sisselaadimine uude andmebaasi privilegeerimata kasutajana. Moodustada -Fc dump

$ /usr/lib/postgresql/9.4/bin/pg_dump -Fc -f baasinimi-20180922-94.dump baasinimi

uue kasutaja moodustamine

postgres=# create role uuskasutajanimi login password 'fakeparool' NOSUPERUSER INHERIT NOCREATEDB NOCREATEROLE;

uue baasi moodustamine

postgres=# create database baasinimi owner = uuskasutajanimi;

andmete sisselaadimine baasi ülikasutajana (postgres)

postgres$ /usr/lib/postgresql/9.4/bin/pg_restore -d baasinimi baasinimi-20180922-94.dump

Tundun, et see reassing mõjub ühe create database andmebaasi piires; selles, millega on parasjagu ühendus

sql> reassign owned by vanakasutajanimi to uuskautajanimi;

Andmebaasi vakuumimine

Töötavat PostgreSQL andmebaasi tuleb regulaarselt vakuumida (ingl. k. vacuum) nt sellistel põhjustel

päringud muutuvad kiiremaks kuna planner saab kasutada otsuste tegemisel tegelikkusele enam vastavat infot
andmebaasi andmekluster võtab failisüsteemis vähem ruumi

Vakuumimiseks on kaks võimalust

käsitsi vakuumimine - nt crontab abiga käivitatakse vakuumimist sooritav sql lause
autovacuum - andmebaas nö sisemiste vahendite abil otsustab kunas ja mida vakuumida

Käsitsi vakuumimine

Käsitsi vakuumimine käib põhimõtteliselt öeldes tabeli või baasi kohta (mis tähendab, et tegeldakse baasi kõigi tabelitega)

$ psql -h localhost portaal -U postgres -c "vacuum verbose analyze"

Nt võiks kutsuda crontabist välja sellist skripti kord ööpäevas

#!/bin/bash
renice 19 -p $$ 1>/dev/null
export PGPASSWORD=parool
nyyd=`date +%Y%m%d`
export HOSTNAME=10.100.6.88
export PGPORT=5432
export PGUSER=postgres

mkdir /srv/backup/postgresql/vacuum-logs/$nyyd

psql_baasid=`/usr/local/postgresql/bin/psql -h $HOSTNAME -p$PGPORT template1 -U $PGUSER -c "\l" \
| sed -e '1,3d' | sed -e '$d' | sed -e '$d' | awk {'print $1'}`

for i in $psql_baasid
  do
    if test "$i" != "template0" && test "$i" != "template1" && test "$i" != "postgres"; then
      /usr/local/postgresql/bin/psql -h $HOSTNAME -p$PGPORT $i -U $PGUSER -c "vacuum verbose analyze" \
        1>/data/backup/postgresql/vacuum-logs/$nyyd/$HOSTNAME-$nyyd-pg_$i-vacuum-analyze-5432.txt 2>&1;
        echo "exit code: $?" >> /data/backup/postgresql/vacuum-logs/$nyyd/$HOSTNAME-$nyyd-pg_$i-vacuum-analyze-5432.txt
    fi
  done

seejuures tuleb tähele panna, et

ps auxe esitab vakumeerimise ajal protsesside keskkonnamuutujate väärtused ning kui süsteemis saavad anda käske asjassepuutumatud kasutajad, siis on neil võimalik saada teada see parool

Vakuumimisega seotud ressurssikasutust saab kontrollida /srv/postgresql/postgresql.conf seadistusfaili parameetritega, http://www.postgresql.org/docs/8.3/static/runtime-config-resource.html#RUNTIME-CONFIG-RESOURCE-VACUUM-COST

 # - Cost-Based Vacuum Delay -
 
 vacuum_cost_delay = 10                  # 0-1000 milliseconds
 #vacuum_cost_page_hit = 1               # 0-10000 credits
 #vacuum_cost_page_miss = 10             # 0-10000 credits
 #vacuum_cost_page_dirty = 20            # 0-10000 credits
 #vacuum_cost_limit = 200                # 1-10000 credits

kus

vacuum_cost_delay = 10 - vähendab plokkseadme I/O kasutust

Vahel võib vakuumi logist leida huvitavaid teateid, nt selline, siis tuleks postgresql.conf failis max_fsm_pages parameetri väärtust varuga vastavalt suurendada

 NOTICE:  number of page slots needed (1875152) exceeds max_fsm_pages (1400000)
 HINT:  Consider increasing the configuration parameter "max_fsm_pages" to a value over 1875152.

Kui nö tavaline vacuum ei saavuta soovitud tulemus, sobib proovida vacuum full

sql> \c andmebaas
sql> vacuum full;

seejuures tuleb arvestada, et

parem kui vacuum full ajal rakendused baasi ei kasuta
vacuum full võtab palju aega ja tekitab tugeva IO koormuse
vacuum full kasutab ajutisel sama palju ruumi kui andmebaasi ise (õieti kõige suurem tabel)

Autovacuum

Autovacuum võib olla sisselülitatud või väljalülitatud kusjuures autovacuum juhtub igal juhul automaatsel kui mõne tabeli pg_class.relfrozenxid suurus ületab seadistusfailis näidatud väärtused (vaikimisi 200 M).

autovacuum_freeze_max_age (integer)

Specifies the maximum age (in transactions) that a table's pg_class.relfrozenxid field can attain before a VACUUM operation is 
forced  to prevent transaction ID wraparound within the table. Note that the system will launch autovacuum processes to prevent
wraparound even when autovacuum is otherwise disabled. The default is 200 million transactions. This parameter can only be set
at server start, but the setting can be reduced for individual tables by entries in pg_autovacuum.

Autovacuum toimimist iseloomustavad tabeli vastavad tulbad

SQL> select * from pg_stat_user_tables;

Andmete varundamine ja taaste WAL logide abil

PostgreSQL abil saab andmeid varundada nn Full, Differential ja Incremental viisil

full - varundatud andmetest piisab varundamise hetkel töötanud andmebaasi seisu taastamiseks
differential - varundatud andmetest ja ning viimasest full backupist piisab viimase differential varundamise hetkel töötanud andmebaasi seisu taastamiseks; iga differential backupi tegemisel varundatakse kõik viimasest fullile järgnenud muudatused
incremental - varundatud andmetest, kõigist viimase full backupist alatest tehtud muudest incrementalitest ja full backupist piisab viimase differential varundamise hetkel töötanud andmebaasi seisu taastamiseks; iga incremental backupi teegmisel varundatakse kõik viimati tehtud incrementalile järgnenud muudatused

Et võimalikest crash-situatsioonidest paremini välja tulla, kirjutab PostgreSQL kõik andmebaasi suhtes sooritatud tegevused andmeklustri alamkataloogi pg_xlog spetsiaalses formaadis logifailidesse, nn WAL (ingl. k. write ahead log) logidesse. Töötamise ajal võiks see kataloog välja näha nt selline

 $ find /data/postgresql/pg_xlog/ -ls
 7913473    4 drwx------   3 postgres postgres     4096 Apr  5 15:21 /data/postgresql/pg_xlog/
 7913480 16404 -rw-------   1 postgres postgres 16777216 Apr  5 15:14 /data/postgresql/pg_xlog/000000040000004600000081
 7913476 16404 -rw-------   1 postgres postgres 16777216 Apr  5 14:08 /data/postgresql/pg_xlog/00000004000000460000007E
 7913478 16404 -rw-------   1 postgres postgres 16777216 Apr  5 13:49 /data/postgresql/pg_xlog/00000004000000460000007D
 7913485 16404 -rw-------   1 postgres postgres 16777216 Apr  5 13:23 /data/postgresql/pg_xlog/00000004000000460000007C
 7913474    4 drwx------   2 postgres postgres     4096 Apr  5 15:21 /data/postgresql/pg_xlog/archive_status
 7913487    0 -rw-------   1 postgres postgres        0 Apr  5 00:23 /data/postgresql/pg_xlog/archive_status/00000004.history.done
 7913475    0 -rw-------   1 postgres postgres        0 Apr  5 06:03 /data/postgresql/pg_xlog/archive_status/000000040000004600000066.00557058.backup.done
 7913477 16404 -rw-------   1 postgres postgres 16777216 Apr  5 15:34 /data/postgresql/pg_xlog/00000004000000460000007A
 7913483    4 -rw-------   1 postgres postgres      243 Apr  5 06:03 /data/postgresql/pg_xlog/000000040000004600000066.00557058.backup
 7913486    4 -rw-------   1 postgres postgres       74 Apr  5 00:23 /data/postgresql/pg_xlog/00000004.history
 7913488 16404 -rw-------   1 postgres postgres 16777216 Apr  5 14:52 /data/postgresql/pg_xlog/000000040000004600000080
 7913479 16404 -rw-------   1 postgres postgres 16777216 Apr  5 14:30 /data/postgresql/pg_xlog/00000004000000460000007F
 7913481 16404 -rw-------   1 postgres postgres 16777216 Apr  5 12:57 /data/postgresql/pg_xlog/00000004000000460000007B

Selleks, et vähendada andmekadu, loetakse crash-situatsioonist väljudes viimasele checkpoint'ile otsa andmed WAL logist.

Kuigi tavaliselt pg_xlog kataloogis olevaid faile roteeritakse vastavalt checkpointide juhtumisele, siis on võimalik ka enne roteerimist vanemad WAL logid kopeerida eraldi kataloogi selleks, et neid vajadusel kasutada mõnele mineviku ajahetkele vastava andmebaasi seisu taastamiseks. Seda tegevust nimetatakse WAL logide arhiveerimiseks.

Et WAL logide abil saaks andmebaasi taastada tuleb teha sellised ettevalmistused

käivitada andmebaas WAL logisid arhiveerivas režiimis
kopeerida arhiveeritud WAL logid varundusse (st kuhugi teise andmete varundamisega tegelevasse arvutisse)
salvestada andmebaasi nn täiskoopia varundusse

WAL logide abil andmebaasi taastamine toimub sellise järgnevusena

andmebaasi protsesside töö on lõpetatud
varundusest kopeeritakse andmeklustri kataloogi varem salvestatud nn täiskoopia
andmebaasile tehakse kättesaadavaks arhiveeritud WAL logid, nt ühendades andmebaasi arvutile külge üle NFS'i
andmebaasi käivitatakse WAL logisid peale lugevas režiimis

Lisaks taastamisele sobib see tehnika nt töötava andmebaasi kõrvale teise arvutisse andmebaasi mingi seisu moodustamiseks. Tundub, et wal logide järgnevuse kasutamist ei sega, kui selle logi tekkimise ajal on andmebaas crashinud.

WAL logide arhiveerimine

WAL logide arhiveerimise sisselülitamiseks tuleb tuleb näidata seadistusfailis ära kahe parameetri väärtused nt selliselt ning muudatuse kehtestamiseks andmebaas seisata ja käivitada

 archive_mode = on               # allows archiving to be done
 archive_command = 'test ! -f /data/backup/postgresql/archive-logs/%f && cp %p /data/backup/postgresql/archive-logs/%f'
 # archive_timeout = 60

arhive_mode - lülitab sisse andmebaasi tavalise töö taustal wal logide kirjutamise
archive_command - näitab kuhu wal logid kopeerida
archive_timeout - näitab millise ajalise intervalliga järmine WAL logi fail tekitatakse; kui parameetrit ei kasutata, siis moodustatakse järgmine andmete kogunemise mahu alusel

Tulemusena tekivad /data/backup/postgresql/archive-logs kataloogi sellised failid

 ...
 -rw------- 1 postgres postgres 16777216 Apr  5 07:23 000000040000004600000067
 -rw------- 1 postgres postgres 16777216 Apr  5 08:12 000000040000004600000068
 -rw------- 1 postgres postgres 16777216 Apr  5 08:53 000000040000004600000069
 -rw------- 1 postgres postgres 16777216 Apr  5 09:23 00000004000000460000006A
 -rw------- 1 postgres postgres 16777216 Apr  5 09:53 00000004000000460000006B
 -rw------- 1 postgres postgres 16777216 Apr  5 10:20 00000004000000460000006C
 -rw------- 1 postgres postgres 16777216 Apr  5 10:40 00000004000000460000006D
 ..

Andmeklastri failisüsteemi täiskoopia salvestamine

Andmebaasi töö käigus andmeklastri failisüsteemist koopiat tehes tuleb see failisüsteem viia nö kooskõlalisse olekusse. Selleks sobib kasutada sellist järgnevust

peatame andmeklustrisse muudatuste kirjutamise

 $ psql -U postgres postgres -c "select pg_start_backup('backup');"

kopeerida andmeklastri sisu varundusarvutisse, nt rsync abil
jätkame andmeklastrisse muudatuste kirjutamist

 $ psql -U postgres postgres -c "select pg_stop_backup();"

See ei ole eriti oluline kui kaua süsteem on peatatud muudatuste kirjutamise olekus, praktiliselt ei ole hullu kui ta on seal ka mitu tundi. Alternatiiv on

öelda pg_start_backup
moodustada andmeklastrist LVM snapshot
öelda pg_stop_backup
ühendada snapshot külge ja kopeerida andmed varundusarvutisse
ühendada snapshot lahti ja kustutada snapshot

Andmebaasi taastamine WAL logide abil kuni võimalikult kaugele

Olgu andmebaasi arvutis juhtunud mingi selline sündmus, mille tulemusena tuleb varundusest andmebaas taastada võimalikult kaugele, st võimalikult väikese andmekaoga.

Lähtepunktiks on tarvis nelja asja

Samal arhitektuuril ja versiooniga andmebaasi nn binari install kui see, mida varundati
andmeklustri failisüsteemi täiskoopia
peale täiskoopia moodustamist kogunenud WAL logid, vähemalt kuni 'select pg_stop_backup();' ütlemiseni
veel arhiveerimata WAL logid kataloogist pg_xlog (kui need on olemas ja võimalusel kopeerida suletud andmebaasi tingimustes)

Andmebaasi saab taastada sellise tegevuste järgnevuse abil

Andmebaasi mootor ei käi
Kopeerida andmebaasi andmeklustri failisüsteemi (nt /srv/postgresql) varundamise käigus moodustatud täiskoopia
Kustutada /srv/postgresql/pg_xlog kataloogist failid (alamkaataloog archive_status alles jätta, uuemal ajal võib ka selle kustutada, moodustatakse automaatselt tagasi, v 8.4 ja 9.0 puhul)

 $ find /srv/postgresql/pg_xlog -type f -exec rm {} \;

Kui on võimaik, kopeerida viimati töötanud andmebaasi failisüsteemist /srv/postgresql/pg_xlog kataloogist failid taastatava arvuti vastavasse kataloogi
Tekitada nt sellise sisuga fail /srv/postgresql/recovery.conf andmeklusteri kataloogi, fail peab olema postgres kasutaja oma, sest peale protseduuri lõppu nimetatakse see fail ringi recovery.done nimega; restore_command näitab, kus WAL logid asuvad

 restore_command = 'cp /srv/backup/postgresql/archive-logs/%f %p'

Paigutada WAL logid kataloogi /srv/backup/postgresql/archive-logs
Andmeklustri kataloogis peab olema fail backup_label, millest saab süsteem taasteks kasutatava esimese wal logi faili nime teada, tegevuse käigus nimetatakse see ümber backup_label.old'iks
Ajutiselt baasi seadistusfailist WAL logide arhiveerimist välja lülitada ei ole vaja
Käivitada andmebaas tavapäraselt viisil

Käivitamisel tekivad sellised sissekanded andmebaasi logisse

 2009-04-04 23:53:33 EEST    7318  49d7c8cd.1c96  1 2009-04-04 23:53:33 EEST 0 LOG:  database system was interrupted; last known up at 2009-04-04 22:13:52 EEST
 2009-04-04 23:53:33 EEST    7318  49d7c8cd.1c96  2 2009-04-04 23:53:33 EEST 0 LOG:  starting archive recovery
 2009-04-04 23:53:33 EEST    7318  49d7c8cd.1c96  3 2009-04-04 23:53:33 EEST 0 LOG:  restore_command = 'cp /data/backup/postgresql/archive-logs/%f %p'
 cp: stat `/data/backup/postgresql/archive-logs/00000001.history' ei Ãµnnestu: No such file or directory
 2009-04-04 23:53:34 EEST    7318  49d7c8cd.1c96  4 2009-04-04 23:53:33 EEST 0 LOG:  restored log file "000000010000004600000059" from archive
 2009-04-04 23:53:34 EEST    7318  49d7c8cd.1c96  5 2009-04-04 23:53:33 EEST 0 LOG:  automatic recovery in progress
 2009-04-04 23:53:34 EEST    7318  49d7c8cd.1c96  6 2009-04-04 23:53:33 EEST 0 LOG:  redo starts at 46/59DB60E0
 2009-04-04 23:53:34 EEST    7318  49d7c8cd.1c96  7 2009-04-04 23:53:33 EEST 0 LOG:  restored log file "00000001000000460000005A" from archive
 2009-04-04 23:53:35 EEST    7318  49d7c8cd.1c96  8 2009-04-04 23:53:33 EEST 0 LOG:  restored log file "00000001000000460000005B" from archive
 2009-04-04 23:53:35 EEST    7318  49d7c8cd.1c96  9 2009-04-04 23:53:33 EEST 0 LOG:  restored log file "00000001000000460000005C" from archive
 2009-04-04 23:53:36 EEST    7318  49d7c8cd.1c96  10 2009-04-04 23:53:33 EEST 0 LOG:  restored log file "00000001000000460000005D" from archive
 cp: stat `/data/backup/postgresql/archive-logs/00000001000000460000005E' ei Ãµnnestu: No such file or directory
 2009-04-04 23:53:37 EEST    7318  49d7c8cd.1c96  11 2009-04-04 23:53:33 EEST 0 LOG:  record with zero length at 46/5E2CC3A0
 2009-04-04 23:53:37 EEST    7318  49d7c8cd.1c96  12 2009-04-04 23:53:33 EEST 0 LOG:  redo done at 46/5E2CC358
 2009-04-04 23:53:37 EEST    7318  49d7c8cd.1c96  13 2009-04-04 23:53:33 EEST 0 LOG:  last completed transaction was at log time 2009-04-04 23:47:30.504329+03
 cp: stat `/data/backup/postgresql/archive-logs/00000001000000460000005E' ei Ãµnnestu: No such file or directory
 2009-04-04 23:53:37 EEST    7318  49d7c8cd.1c96  14 2009-04-04 23:53:33 EEST 0 LOG:  restored log file "00000002.history" from archive
 cp: stat `/data/backup/postgresql/archive-logs/00000003.history' ei Ãµnnestu: No such file or directory
 2009-04-04 23:53:37 EEST    7318  49d7c8cd.1c96  15 2009-04-04 23:53:33 EEST 0 LOG:  selected new timeline ID: 3
 cp: stat `/data/backup/postgresql/archive-logs/00000001.history' ei Ãµnnestu: No such file or directory
 2009-04-04 23:53:38 EEST    7318  49d7c8cd.1c96  16 2009-04-04 23:53:33 EEST 0 LOG:  archive recovery complete
 2009-04-04 23:53:52 EEST    7316  49d7c8cd.1c94  2 2009-04-04 23:53:33 EEST 0 LOG:  database system is ready to accept connections

Korrektsel juhutumil hakatakse kasutama logisid alates sellest failis mis on backup_label failis kirjas stop wal location juures.

Ehk on ka logide sisselugemisel huvitav jälgida millised postgres kasutaja protsessid samal aja töötavad

 $ ps aux | grep postgres
 ...
 postgres  2080 13.0 12.7 1125532 1073016 ?     Ss   21:48   1:30 postgres: startup process   waiting for 00000001000000460000005B
 postgres  2468  9.0  0.0   9420   732 ?        D    22:00   0:00 cp /mnt/archive-logs/00000001000000460000005B pg_xlog/RECOVERYXLOG

Peale logide sisselugemist jääb andmebaas käima nö kasutataval kujul. Kui protseduuri käigus oli WAL logide arhiveerimine välja lülitatud, tuleks baas siiski korraks kinni panna, logimine sisse lülitada ning uuesti käivitada.

Andmebaasi taastamine WAL logide abil kuni ettenähtud ajahetkeni

Olgu andmebaasi arvutis juhtunud mingi selline sündmus, mille tulemusena tuleb varundusest andmebaas taastada ettenähtud ajahetkeni (ingl. k. PITR - Point in Time Recovery).

Lähtepunktiks on tarvis kolme asja

Samal arhitektuuril ja versiooniga andmebaasi nn binari install kui see, mida varundati
andmeklustri failisüsteemi täiskoopia
peale täiskoopia moodustamist kogunenud WAL logid, vähemalt kuni 'select pg_stop_backup();' ütlemiseni

Andmebaasi saab taastada sellise tegevuste järgnevuse abil

Andmebaasi mootor ei käi
Kopeerida andmebaasi andmeklustri failisüsteemi (nt /srv/postgresql) varundamise käigus moodustatud täiskoopia
Kustutada /srv/postgresql/pg_xlog kataloogist failid (alamkaataloog archive_status alles jätta)

 $ find /data/postgresql/pg_xlog -type f -exec rm {} \;

Andmeklustri kataloogis peab olema fail backup_label, millest saab süsteem taasteks kasutatava esimese wal logi faili nime teada, tegevuse käigus nimetatakse see ümber backup_label.old'iks
Tekitada nt sellise sisuga fail /srv/postgresql/recovery.conf andmeklusteri kataloogi, fail peab olema postgres kasutaja oma, sest peale protseduuri lõppu nimetatakse see fail ringi recovery.done nimega; restore_command näitab, kus WAL logid asuvad (http://www.postgresql.org/docs/8.3/static/datetime-keywords.html)

 restore_command = 'cp /srv/backup/postgresql/archive-logs/%f %p'
 recovery_target_time = '2009-04-20 22:39:00 EETDST'

Paigutada WAL logid kataloogi /srv/backup/postgresql/archive-logs
Lülitada ajutiselt baasi seadistusfailis WAL logide arhiveerimine välja
Käivitada andmebaas tavapäraselt viisil

Peale logide sisselugemist jääb andmebaas käima nö kasutataval kujul. Kuna protseduuri käigus oli WAL logide arhiveerimine välja lülitatud, tuleks baas siiski korraks kinni panna, logimine sisse lülitada ning uuesti käivitada.

Ajahetkeni taastamisel tekib selline log, muuhulgas öeldakse kuhu maani taastati

 2009-04-24 22:15:14 EEST    2655  49f20e37.a5f  150 2009-04-24 22:08:39 EEST 0 LOG:  restored log file "000000040000004C0000004C" from archive
 2009-04-24 22:15:15 EEST    2655  49f20e37.a5f  151 2009-04-24 22:08:39 EEST 0 LOG:  restored log file "000000040000004C0000004D" from archive
 2009-04-24 22:15:16 EEST    2655  49f20e37.a5f  152 2009-04-24 22:08:39 EEST 0 LOG:  recovery stopping before commit of transaction 95521631, time 2009-04-20 22:39:00.001938+03
 2009-04-24 22:15:16 EEST    2655  49f20e37.a5f  153 2009-04-24 22:08:39 EEST 0 LOG:  redo done at 4C/4D8E6BD0
 2009-04-24 22:15:16 EEST    2655  49f20e37.a5f  154 2009-04-24 22:08:39 EEST 0 LOG:  last completed transaction was at log time 2009-04-20 22:38:59.779467+03
 cp: stat `/data/backup/postgresql/archive-logs/00000005.history' ei Ãµnnestu: No such file or directory
 2009-04-24 22:15:16 EEST    2655  49f20e37.a5f  155 2009-04-24 22:08:39 EEST 0 LOG:  selected new timeline ID: 5
 2009-04-24 22:15:16 EEST    2655  49f20e37.a5f  156 2009-04-24 22:08:39 EEST 0 LOG:  restored log file "00000004.history" from archive
 2009-04-24 22:15:17 EEST    2655  49f20e37.a5f  157 2009-04-24 22:08:39 EEST 0 LOG:  archive recovery complete
 2009-04-24 22:15:46 EEST    2653  49f20e36.a5d  2 2009-04-24 22:08:38 EEST 0 LOG:  database system is ready to accept connections

Ajahetkeni taastamisel peab arvestama, et see aega saab olla peale pg_stop_backup ütlemise ajahetke ja arusaadaval ei saa see olla hilisem kui on kasutada wal logisid.

Varundamise monitooring Nagiose passiivse kontrolliga

Varundamise skript lõppu tuleb lisada

if [ $ec_psql -eq 0 ] && [ $ec_rsync -eq 0 -o $ec_rsync -eq 24 ]; then
  echo -e "db.loomaaed\tbackup\t0\tbackup korras" | send_nsca -c /etc/send_nsca.cfg -H mon.loomaaed -p 5667
else
  echo -e "db.loomaaed\tbackup\t2\tbackup katki" | send_nsca -c /etc/send_nsca.cfg -H mon.loomaaed -p 5667
fi

kus

juhtumil kui psql või rsync käsud on õnnestunud saadatetakse korras nagiosele signaal
juhtumil kui psql või rsync käsud on õnnestunud saadatetakse katki nagiosele signaal

ning Nagioses kirjeldada passiivne kontroll

define service {  
  host_name                  www-1.auul 
  service_description        backup
  use                        passive-generic-service
}

Andmebaasi UTF-8 kodeeringuvigade parandamine

Järnev skript kontrollib sisendisse antud sql dump faili vastavust utf8 kodeeringule ning väljastab vigaste kirjete kohta andmed

#!/usr/bin/python
import sys, time

rownr = 0
t0 = t1 = time.time()
next = sys.stdin.readline

errors = open('utf8errors.log','w')

while 1:
    row = next()
    if not row:
        break
    try:
        urow = row.decode('utf8')
    except:
        print row
        errors.write(row)
    rownr += 1
    if rownr % 1000000 == 0:
        t2 = time.time()
        print rownr, t2 - t1, t2 - t0
        t1 = t2

print 'Done!'
t2 = time.time()
print rownr, t2 - t1, t2 - t0

Kasutamine toimub öeldes

 $ cat dump.sql | ./utf8check.py

Misc

show <tab> - esitab nimekirja võimalikest küsimustest, nt

 show max_connections;
 max_connections 
-----------------
 100
(1 row)

Andmebaasi poolt failisüsteemis kasutatud mahu küsimine, sisaldab indekseid

sql> SELECT pg_size_pretty(pg_database_size('andmebaasinimi')) As fulldbsize;

Tabeli suuruse küsimine

sql> SELECT pg_size_pretty(pg_total_relation_size('skeeminimi.tabelinimi')) As fulltblsize, \
  pg_size_pretty(pg_relation_size('skeeminimi.tabelinimi')) As justthetblsize;

Kui andmebaasi vacuumil esineb anomaaliaid, siis võib olla abiks baasi vacuumimine tabeli kaupa. Tabelite nimekirja saab küsida andmebaasilt öeldes

$ psql -U postgres -h hostname -c "select n.nspname||'.'||c.relname from pg_class c join pg_namespace n on \
  (c.relnamespace=n.oid) where relkind='r' order by 1;" baasinimi > vacuum-tabelid.txt

ning saadud nimekirja abil toimub vakumeerimine öeldes

$ for i in `cat vacuum-tabelid.txt`; do psql -c "vacuum verbose analyze $i" -U postgres -h hostname -p5432 baasinimi \
  1> $i-1.log 2> $i-2.log; sleep 5; done

v. 8.4 - failinime järgi tabeli leidmine, kui failisüsteemis on suured failid ja tekib küsimus, millise tabeliga on nad seotud, sobib öelda nii

$ du -sk /data/postgresql/8.4/main/base/16400/* | sort -n | tail -n 4
1049604 /data/postgresql/8.4/main/base/16400/195106.6
1049604 /data/postgresql/8.4/main/base/16400/195106.7
1049604 /data/postgresql/8.4/main/base/16400/195106.8
1049604 /data/postgresql/8.4/main/base/16400/195106.9

$ /usr/lib/postgresql/8.4/bin/oid2name -H 127.0.0.1 -U postgres -d loomaaed -f 195106 -x
From database "loomaaed":
 Filenode       Table Name     Oid    Schema  Tablespace
---------------------------------------------------------
   195106  pg_toast_195103  195106  pg_toast  pg_default

$ /usr/lib/postgresql/8.4/bin/oid2name -H 127.0.0.1 -U postgres -d loomaaed -f 195103 -x
From database "loomaaed":
 Filenode             Table Name    Oid  Schema  Tablespace
------------------------------------------------------------
   195103  tabelinimi  74224  wizard  pg_default

Tulumusena on teada, et 195106.6 fail on seotud wizard.tabelinimi tabeliga.

v. 9.4 - failinime järgi tabeli leidmine, kui failisüsteemis on suured failid ja tekib küsimus, millise tabeliga on nad seotud, sobib öelda nii

# \c baasinimi
baasinimi=# select pg_filenode_relation(0,233328054);
 pg_filenode_relation 
----------------------
 baasinimi
(1 row)

baasinimi=# select pg_relation_filepath('tabelinimi');
 pg_relation_filepath 
----------------------
 base/16424/233328054
(1 row)

Andmebaasi krahh

Andmebaasi krahh (ingl. k. crash) on selline olukord kus andmebaasi töö on lõppenud ilma nö normaalselt andmebaasi protsesse seisates, nt öeldes

# pg_ctlcluster 9.2 main stop

Krahh võivad tekkida nt järgmistel juhtudel

seoses operatsioonisüsteemi krahhiga (nt arvutil kaob toide)
andmefailide failisüsteem saab täis
andmebaasi ise või mõni moodul kasutab mälu valesti ja kogu baasi töö lõpetatakse (andmebaasi teeb endale ise restardi)

Anmdmebaasi käivitamine peale krahhi

Üldiselt PostgreSQL andmebaas ei lähe krahhi tulemusena katki, andmebaas kasutab failisüsteemi sellisel viisil, et järgmisel käivitamisel jõuab baas viimase töötava seisuni (transaktsioonini) ja jätkab sealt. Midagi erilist pole teha vaja lisaks tavalisele baasi käivitamisel, logisse kirjutatakse seejuures

TODO

Krahh PITR varundamise ajal

Kui enamusel juhtudel peale krahhi toimumist piisab andmebaas tavalisel moel käivitada ja ta jätkab tööd, siis PITR backupi (st pg_start_backup/pg_stop_backup) tegemise ajal toimunud krahhi puhul on andmeklastri kataloogis ees fail, mis segab käivitumist

/data/postgresql/backup_label

Samal ajal öeldakse logisse

2013-03-20 12:10:25 EET    15966  51498b11.3e5e  1 2013-03-20 12:10:25 EET 0 LOG:  database system was interrupted; last known up at 2013-03-20 12:10:09 EET
2013-03-20 12:10:25 EET    15966  51498b11.3e5e  2 2013-03-20 12:10:25 EET 0 LOG:  could not open file "pg_xlog/00000001000005E600000008" (log file 1510, segment 8): \
  No such file or  directory
2013-03-20 12:10:25 EET    15966  51498b11.3e5e  3 2013-03-20 12:10:25 EET 0 LOG:  invalid checkpoint record
2013-03-20 12:10:25 EET    15966  51498b11.3e5e  4 2013-03-20 12:10:25 EET 0 PANIC:  could not locate required checkpoint record
2013-03-20 12:10:25 EET    15966  51498b11.3e5e  5 2013-03-20 12:10:25 EET 0 HINT:  If you are not restoring from a backup, try removing the file "/data/postgresql/backup_label".
2013-03-20 12:10:25 EET batchmanager portaal 127.0.0.1(50593) 15969  51498b11.3e61  1 2013-03-20 12:10:25 EET 0 FATAL:  the database system is in recovery mode
2013-03-20 12:10:25 EET eit1 xportal 10.100.6.75(55188) 15970  51498b11.3e62  1 2013-03-20 12:10:25 EET 0 FATAL:  the database system is in recovery mode
2013-03-20 12:10:25 EET    21687  513baab9.54b7  37 2013-03-09 23:33:45 EET 0 LOG:  startup process (PID 15966) was terminated by signal 6: Aborted
2013-03-20 12:10:25 EET    21687  513baab9.54b7  38 2013-03-09 23:33:45 EET 0 LOG:  aborting startup due to startup process failure

kus

on näha, et baasi käivitamisega on probleem
HINT annab teada, mida teha, tuleb eemaldada pg_start_backup() ütlemisega tekitatud fail backup_label

$ rm /data/postgresql/backup_label

Seejärel võib baasi tavapärasel viisil edasi kasutada

Krahhi uurimine

Kui nt PL keeles tehtud protseduur kasutab mõnda teeki, mis omakorda kasutab mõnda teeki, mida aga failisüsteemis ei ole, siis tavaliselt andmebaas crashib teatega

2010-05-24 16:10:09 EEST    21463  4bf28ed8.53d7  3 2010-05-18 15:58:00 EEST 0 LOG:  server process (PID 32188) exited with exit code 12
2010-05-24 16:10:09 EEST    21463  4bf28ed8.53d7  4 2010-05-18 15:58:00 EEST 0 LOG:  terminating any other active server processes

Põhjusele võib aidata jälile jõuda mainitud PID väärtust eestpoolt logist otsides, nt antud juhtumil

2010-05-24 16:01:19 EEST gateway portaal 127.0.0.1(57375) 32188 SELECT 4bfa789f.7dbc SELECT 1 2010-05-24 16:01:19 EEST 0 \
  WARNING:  error from Perl function "sqlora": install_driver(Oracle) failed: Can't load
  '/usr/local/lib/perl/5.8.8/auto/DBD/Oracle/Oracle.so' for module DBD::Oracle: libclntsh.so.10.1: cannot open shared object file: \
  No such file or directory at /usr/lib/perl/5.8/DynaLoader.pm line 225.
        at line 5
       Compilation failed in require at line 3.
       Perhaps a required shared library or dll isn't installed where expected
        at line 11
2010-05-24 16:01:19 EEST gateway portaal 127.0.0.1(57375) 32188 SELECT 4bfa789f.7dbc SELECT 2 2010-05-24 16:01:19 EEST 0 \
  CONTEXT:  PL/pgSQL function "low" line 2 at RETURN
       PL/pgSQL function "field" line 335 at assignment
       PL/pgSQL function "sisu" line 502 at assignment
       PL/pgSQL function "show" line 56 at assignment
Out of memory!

Andmebaasi monitooring

Üheks andmebaasi oluliseks andmebaasi seisundit iseloomustavaks näitajaks on kui kaugel ta on nn wraparound ajast, arv peab olema alati alla 2g ja seda hoiab väiksena korrapärane andmebaasi vakumeerimine

SQL> SELECT relname, age(relfrozenxid) FROM pg_class WHERE relkind = 'r';
SQL> SELECT datname, age(datfrozenxid) FROM pg_database;

Andmebaasi sisemisi näitajaid sobib kasutada Cactiga graafikute joonistamiseks või Nagiosegaga alarmi saatmiseks, nt http://bucardo.org/wiki/Check_postgres.

Kasulikud materjalid

http://kuutorvaja.eenet.ee/wiki/Nagiose_kasutamine_Debian_Lenniga#PostgreSQL

Failisüsteemi kasutamine

Tekst http://www.postgresql.org/docs/9.0/static/storage-file-layout.html kirjeldab kuidas PostgreSQL andmebaas kasutab failisüsteemi

faili-või kataooginimi	  Kirjeldus
PG_VERSION	          A file containing the major version number of PostgreSQL
base	                  Subdirectory containing per-database subdirectories
global	                  Subdirectory containing cluster-wide tables, such as pg_database
pg_clog	          Subdirectory containing transaction commit status data
pg_multixact	          Subdirectory containing multitransaction status data (used for shared row locks)
pg_notify	          Subdirectory containing LISTEN/NOTIFY status data
pg_stat_tmp	          Subdirectory containing temporary files for the statistics subsystem
pg_subtrans	          Subdirectory containing subtransaction status data
pg_tblspc	          Subdirectory containing symbolic links to tablespaces
pg_twophase         	  Subdirectory containing state files for prepared transactions
pg_xlog	          Subdirectory containing WAL (Write Ahead Log) files
postmaster.opts	  A file recording the command-line options the server was last started with
postmaster.pid	          A lock file recording the current server PID and shared memory segment ID (not present after server shutdown

Andmebaaside OID väärtusi kasutadakse failisüteemis kataloogis base asuvate andmebaasidele vastavate kataloogide nimedena

SQL> SELECT datname, oid FROM pg_database;

Andmebaasi kataloogis asub selliseid faile

tabelitele ja indeksitele vastavad failid, mille nimedena kasutatakse üldiselt vastavad OID väärtusi
tabeli ja indeksi failiga kaasnevad vastavad *_fsm ja *_vm failid, mis on vastavalt free space map ning visibility map
kui tabeli 8kB suurusse pagesse ei mahu tabeli rida ära, siis kasutatakse vastavate andmete hoidmiseks TOAST (The Oversized-Attribute Storage Technique) faili
kui tabeli on üle 1 GB suur, siis hoitakse vastavaid andmeid OID.1, OID.2 jne nimelistes failides

Tabeli nimi, oid väärtuse, kasutatud 8kB lehted ja tabelis sisalduvate korteežide arvu kohta saab küsida selliselt

SQL> select relname, oid, relpages, reltuples from pg_class limit 10;
         relname          |  oid  | relpages | reltuples 
--------------------------+-------+----------+-----------
 priidutabel              |  1247 |        7 |       283
 marditabel               | 11550 |        0 |         0
 ...

contrib utiliit oid2name abil saab küsida oid väärtusele vastavat tabelinime

$ /usr/lib/postgresql/8.4/bin/oid2name -H 127.0.0.1 -U postgres -d rsyslog -f 2755 -x 
From database "loomdb":
  Filenode             Table Name   Oid      Schema  Tablespace
---------------------------------------------------------------
      2755            priidutabel  2755       priit  pg_default

Kasutaja autentimine

Vaikimisi toimub andmebaasi kasutaja autentimine selliselt, et

baasi saab üle võrgu sisse logida baasis kirjeldatud kasutaja oma baasis kirjeldatud parooliga
baasi saab lokaalselt sisse logida kasutaja, kelle unix kasutajanimi klapib baasis kirjeldatud kasutajanimega

Kasutaja autentimine /etc/passwd abil

Andmebaasi kasutaja autentimiseks nö süsteemi lokaalse kasutajana sobib kasutada pg_hba.conf failis nt rida

host all all 0.0.0.0/0 pam

ning muuta /etc/shadow faili loabit, seejuures tuleb ise hinnata, kas see muudatus on aktsepteeritav

# chmod o+r /etc/shadow

Kasutaja autentimine Kerberosega

Kerberose kasutaja autentimiseks Kerberosega peab olema kasutada Kerberose infrastruktuur, nt selline nagu kirjeldatud tekstis MIT Kerberose kasutamine Debianiga. Lisaks tuleb

moodustada andmebaasiarvuti PostgreSQL teenusele vastav Kerberose osapool öeldes andmebaasi arvutis kasutajana postgres

$ kadmin -p root/admin -q "addprinc postgres/postgresql.loomaaed"
$ kadmin -p root/admin -q "ktadd -k /etc/postgresql-common/krb5.keytab postgres/postgresql.loomaaed"

kasutada pg_hba.conf failis sarnast rida

# TYPE  DATABASE    USER    CIDR-ADDRESS        METHOD
...
host    all         all     192.168.10.205/32   gss

Eeldusel, et kerberose kasutaja nimi langeb kokku andmebaasi kasutaja nimega saab seejärel kasutaja andmebaasi sisse logida öeldes tavalisel moel

$ psql -h postgresql.loomaaed -U priit priit

Samuti toetab PgAdmin3 GSSAPI kasutamist.

Kasutaja autentimine PAM + LDAP kataloogiga

Eeldusel, et süsteemis on PAM LDAP backend kasutamine ettevalmistatud sobib PostgreSQL kasutajate LDAP kataloogi vastu autentimiseks

PostgreSQL pg_hba.conf seadistusfailis kasutada nt rida

host    all         all        127.0.0.1/32 pam pamservice=postgresql

/etc/pam.d/postgresql failis kasutada ridu (pamservice parameeter näitab PAM teenuse nime)

auth    sufficient      pam_ldap.so
account sufficient      pam_ldap.so

Oluline on tähele panna, et antud asjakorralduse puhul peab PostgreSQL andmebaasis olema kõnealune kasutaja olemas ja tema privileegid kirjeldatud, ainult autentimine toimub PAM+LDAP abil.

Kasutaja autentimine Active Directory vastu

TODO

Andmebaasi tuunimine

Aadressil http://wiki.postgresql.org/wiki/Performance_Optimization on toodud mitmeid viiteid tekstidele, kuidas admebaasi seadistusfaili sobivate seadistuste valimisel suurendada andmebaasi jõudlust.

shared_buffers - kui arvutis ei tööta muid olulisi protsesse peale andmebaasi, siis võiks selle parameetri väärtus olla 1/4 operatsioonisüsteemi mälust (RAM); seejuures tuleb tõenäoliselt suurendada ka kernel.shmmax parameetri väärtust, nt pooleli ram'ist, nt kui ram on 4g, siis sobib öelda

# sysctl -w kernel.shmmax=2147483648

Tavaliselt on kernel.shmall väärtus piisavalt suur, see väljendab kogu jagatud mälu suurust süsteemis page ühikutes (4 kB x86 raual); nt 2097152 = 8G

PostgeSQL enda manuaalis on vastavad juhised aadressil http://www.postgresql.org/docs/8.3/interactive/kernel-resources.html.

max_connections = 750
superuser_reserved_connections = 8
work_mem -
maintainance_work_mem -
effective_cache_size - pool arvuti mälu suurusest

shmall ja shmmax arvutamiseks sobib nt selline skript, http://www.postgresql.org/message-id/4D3B1F75.8040405@2ndquadrant.com

page_size=`getconf PAGE_SIZE`
phys_pages=`getconf _PHYS_PAGES`

if [ -z "$page_size" ]; then
  echo Error:  cannot determine page size
  exit 1
fi

if [ -z "$phys_pages" ]; then
  echo Error:  cannot determine number of memory pages
  exit 2
fi

shmall=`expr $phys_pages / 2`
shmmax=`expr $shmall \* $page_size`

echo \# Maximum shared segment size in bytes
echo kernel.shmmax = $shmmax
echo \# Maximum number of shared memory segments in pages
echo kernel.shmall = $shmall

256 GB mäluga arvutis annab ta sellise tulemuse

# sh shmsetup
# Maximum shared segment size in bytes
kernel.shmmax = 135512178688
# Maximum number of shared memory segments in pages
kernel.shmall = 33084028

Debian Wheezy, Ubuntu 12.04 jt keskkondade ja PGDG andmebaasi puhul paigutatakse need parameetrid /etc/sysctl.d/30-postgresql-shm.conf seadistusfaili.

Kui work_mem väärtus on liig väike, siis kasutatakse tmp faile, nende kasutamisest aitab aimu saada log_temp_files parameeter

#log_temp_files = -1                    # log temporary files equal or larger
                                        # than the specified size in kilobytes;
                                        # -1 disables, 0 logs all temp files

Kasulikud lisamaterjalid

http://pgtune.leopard.in.ua/

Logimine

Andmebaasi tehtud ühenduste logimiseks sobib kasutada ridu

log_connections = on
log_disconnections = on

kasutaja päringute logimiseks

SQL> ALTER USER gateway SET log_statement = 'all';

kuna see täidab tõenäoliselt hästi failisüsteemi, tuleb peale kasutamist logimine uuesti välja lülitada

SQL> ALTER USER gateway SET log_statement = 'none';

Märkused

pg_dump ei salvesta andmebaasi search_path'i, see peale baasi taastamist tuleb sobiv alter lause eraldi öelda, nt

SQL> ALTER DATABASE loomaaed SET search_path=loom, lind;

kasutaja search_path seadmine

SQL> dvk=# ALTER USER dkk_admin SET search_path = dkk, public;

Kui andmebaasi arhiivifaili sisselugemisel keelega seotud teegi asukoht muutub, siis sobib teha kas sobib link, nt

# ln -s /usr/lib/postgresql/8.3/lib/plpgsql.so /usr/local/postgresql/lib/plpgsql.so

või moodustada nö käsitsi vastav keel enne arhiivifaili kasutamist

SQL> CREATE LANGUAGE plpgsql;

Suuremate nö bulk-insertide puhul on normaalne, et logisse ilmuvad sellised teated

2010-06-14 13:40:17 EEST    3260  4c07e97c.cbc  135 2010-06-03 20:42:20 EEST 0 LOG:  checkpoints are occurring too frequently \
  (21 seconds apart)
2010-06-14 13:40:17 EEST    3260  4c07e97c.cbc  136 2010-06-03 20:42:20 EEST 0 HINT:  Consider increasing the configuration \
  parameter "checkpoint_segments".

Kõigile baasi tabelitele, mis võivad asuda erinevates skeemides grantide ütlemine

$ psql -h 127.0.0.1 -U kasutaja baas -c '\dt' | egrep "data|public|wizard|live" | awk '{ print $1 "." $3}' > baas.tabelid
$ for i in `cat baas.tabelid`; do psql -h 127.0.0.1 -U kasutaja baas -c "GRANT SELECT ON TABLE $i TO grupinimi;"; done

sequence viimase väärtuse küsimune, last_value asemele võib kirjutada ka *

baasinimi=# select last_value from skeeminimi.sq_tabelinimi_id;
last_value 
------------
   1009492
(1 row)

Kui ühenduste arv (max_connections) on täis, siis logitakse

2016-07-22 13:49:35 EEST rakendus rakendus 10.100.7.168(38576) 12756 startup 5791fa3f.31d4 startup 1 \
  2016-07-22 13:49:35 EEST 0 FATAL:  remaining connection slots are reserved for non-replication superuser connections

Ligipääsude massiline haldamine

Skeemid

Tõenäoliselt saab nii nö päris schemade nimekirja

SQL> select * from information_schema.schemata where schema_owner != 'postgres';

Kõigile skeemidele portaal_ro non-login rollile USAGE privileegi andmine

SQL> select 'GRANT USAGE ON ' || schema_name || ' TO portaal_ro;' from information_schema.schemata where schema_owner != 'postgres';

Tabelid

TODO

20171017 täiendus

Skeemi public kõigile tabelitele lugemise ligipääsu andmine

SQL> create role wiki_ro;
SQL> \c baasinimi
SQL> GRANT SELECT ON ALL TABLES IN SCHEMA public TO wiki_ro;
SQL> GRANT SELECT ON ALL SEQUENCES IN SCHEMA public TO wiki_ro;
SQL> create role wiki_bi login;
SQL> grant wiki_ro to wiki_bi;

Kasulikud lisamaterjalid

https://jamie.curle.io/creating-a-read-only-user-in-postgres

PostgreSQL SSL toe kasutamine

TODO

Extensionite kasutamine

Nimekirja küsimine

sql> select * from pg_available_extensions order by name;

pg_buffercache

pg_buffefrcache on contrib moodul, kasutamiseks tuleb laadida baasi abivahendid

$ psql -p 5432 -U postgres -d pgbench -f /usr/share/postgresql/9.0/contrib/pg_buffercache.sql

Baasi kustutamine

Reeglina ei saa kustuta create database andmebaasi kui seal on kasutajad küljes, selle vastu võiks aidata selline skript

# cat kustuta-test-baas.sh
/bin/su - postgres -c "psql -U postgres -c \"update pg_database set datallowconn = 'false' where datname = 'test'; \""
/bin/su - postgres -c "psql -U postgres -c \"select pg_terminate_backend(procpid) from pg_stat_activity where datname = 'test'; \""
dropdb -U testija test 1>/dev/null

pg_dump skriptiga töötamine

Tabelinimede küsimine

$ sed '/^CREATE TABLE/!d' baas.sql

Esitada tabeli loomised ridade numbritega

$ sed -n '/^CREATE TABLE/{=;p}' baas.sql

COPY vahemiku otsimine

sed -n '/^COPY/{=;p}' baas.sql > vahemik.sql

Ridade vahemiku esitamine

$ sed -n '15994,16041p' baas.sql > vahemik.sql

Rea eraldamine failist

$ grep ^622087 vahemik.sql > baas-tabel-copy-622087.sql

Märkused

Baasis parasjagu toimuvate tegevuste nimekirja esitamine

postgres=# select  datname,usename,procpid,client_addr,waiting,query_start,current_query FROM pg_stat_activity;
 datname  | usename  | procpid |  client_addr  | waiting |          query_start          |                                            current_query                  
----------+----------+---------+---------------+---------+-------------------------------+------------------------------------------------------------------------------------------------------
 postgres | postgres |    2424 |               | f       | 2013-03-08 10:37:24.551676+02 | select  datname,usename,procpid,client_addr,waiting,query_start,current_query FROM pg_stat_activity;
 prtaal   | postgres |    1673 | 172.19.10.142 | t       | 2013-03-08 09:49:11.287969+02 | SELECT count(*) AS rows FROM ONLY pw.logi
 prtaal   | postgres |   21303 |               | f       | 2013-03-08 09:22:40.516297+02 | ALTER TABLE ONLY logi
                                                                                        :     ADD CONSTRAINT logi_pkey PRIMARY KEY (log_id);

Suuremate tabelite nimekirja esitamine, koos vastavate indexite ja toastidega

SELECT nspname || '.' || relname AS "relation",
   pg_size_pretty(pg_total_relation_size(C.oid)) AS "size"
  FROM pg_class C
  LEFT JOIN pg_namespace N ON (N.oid = C.relnamespace)
  WHERE nspname NOT IN ('pg_catalog', 'information_schema') and relkind='r'
  ORDER BY pg_total_relation_size(C.oid) DESC
  LIMIT 20;

pg_controldata programmiga saab küsida infot andmeklustri kohta, protsessid võiksid sel ajal pigem mitte töötada

$ /usr/lib/postgresql/9.2/bin/pg_controldata /var/lib/postgresql/9.2/main 
pg_control version number:            922
Catalog version number:               201204301
Database system identifier:           6004185537552842495
Database cluster state:               in production
pg_control last modified:             Tue Oct  7 15:01:55 2014
Latest checkpoint location:           1CC/83B86EE0
Prior checkpoint location:            1CC/83AD1C30
Latest checkpoint's REDO location:    1CC/83B7B2C8
Latest checkpoint's TimeLineID:       2
Latest checkpoint's full_page_writes: on
Latest checkpoint's NextXID:          0/160131529
Latest checkpoint's NextOID:          98092825
Latest checkpoint's NextMultiXactId:  13515
Latest checkpoint's NextMultiOffset:  27409
Latest checkpoint's oldestXID:        675
Latest checkpoint's oldestXID's DB:   1
Latest checkpoint's oldestActiveXID:  0
Time of latest checkpoint:            Tue Oct  7 15:01:50 2014
...

defaultist erineva collate ja ctype väärtustega create database baasi tekitamine, eelduseks on, et kõik baasid on UTF-8 kodeeringus

postgres=# create database db_jira_c template = template0 lc_collate = 'C.UTF-8' lc_ctype='C.UTF-8';

tulemusena on

postgres=# \l
                                    List of databases
     Name     |   Owner    | Encoding |   Collate   |    Ctype    |   Access privileges   
--------------+------------+----------+-------------+-------------+----------------------
.. 
 db_jira      | jira       | UTF8     | et_EE.UTF-8 | et_EE.UTF-8 | 
 db_jira_c    | postgres   | UTF8     | C.UTF-8     | C.UTF-8     | 
 template0    | postgres   | UTF8     | et_EE.UTF-8 | et_EE.UTF-8 | =c/postgres          +
              |            |          |             |             | postgres=CTc/postgres
 template1    | postgres   | UTF8     | et_EE.UTF-8 | et_EE.UTF-8 | =c/postgres          +
              |            |          |             |             | postgres=CTc/postgres

Rakendus kasutab andmebaasi

PostgreSQL andmebaasis vaikimis olemas oleva kasutaja nimi on postgres ja seal on olemas create database postgres. Neid kumbagi ei tohiks kasutada rakenduse andmete jaoks. Seoses rakendusega on andmebaasis juurutatud

kasutaja rakendusenimi_admin - sellele kasutajale kuuluvad rakendusega seotud andmebaasi objektid (skeemid, tabelid, funktsioonid jne); kasutaja ei ole PostgreSQL superuser privileegiga
kasutaja rakendusenimi_user - selle kasutajana pöördub baasi poole rakendus, kasutajale on antud grant lausete abil õigus kuhu vaja teha select, update jms; kasutaja ei ole PostgreSQL superuser privileegiga
create database andmebaas rakenduse_baas - selle ja kõigi seal sisalduvate objektide omanik on rakendusenimi_admin, kusjuures rakendus ei tohiks kasutada public skeemi vaid spetsiifiliste nimedega skeeme

Selline tulemus tekib nt sellise järgnevuse tulemusena

ühendutakse uude tühja PostgreSQL andmebaasi kasutajana postgres ning tekitatakse kaks mitte-superuser kasutajat
ühendutakse uude PostgreSQL andmebaasi kasutajana postgres ning tekitatakse rakenduse jaoks create database rakenduse_baas näidates omaniku

sql> create database rakenduse_baas owner = rakendusenimi_admin;

ühendutakse baasi kasutajana rakendusenimi_admin ja tekitatakse andmebaasiobjektid (skeemid, tabelid jne)
ühendutakse baasi kasutajana rakendusenimi_admin ja lisatakse vajalikud grantid rakendusenimi_user jaoks

Oluline on seejuures, et andmebaasi rakenduse_baas süsteemseid objekte ei muudeta ära postgres kasutaja omandusest (nt create database rakendusenimi_baas skeemid information_schema või pg_catalog).

Kui selliselt moodustatud baasist (või mõnest osast, nt skeem, tabel) teha postgres või rakendusenimi_admin kasutajana dump, siis on seal automaatselt sees vajalikud alter ja grant laused. Kui mõnes teises PostgreSQL andmebaasiserveris on olemas kasutajad rakendusenimi_admin ja rakendusenimi_user, siis saab sinna mainitud dumpi laadida sisse postgres või rakendusenimi_admin kasutajana ning tekivad sobivate omanikega ja grantidega objektid.

LVM, NFS ja PostgreSQL kasutamine andmebaasi hooldustöös

Toetudes sellistele asjaoludele, saab kasutada kiireid ja mugavaid haldusprotseduure

Debiani ja Ubuntu paketihalduse PostgreSQL sisaldab võimalust hästi hõlpsasti käivatada ühes arvutis st operatsioonisüsteemis mitut andmebaasi eksemplari (st postgres protsesside komplekti)
LVM plokkseadme haldusvahendid
NFS serveri ja kliendi võimalused

LVM kasutamine PostgreSQL andmebaasiga

Käesolevas punktis juhitakse tähelepanu kuidas PostgreSQL töös kasutada ära LVM võimalusi. Põhiliselt seisneb see LVM snapshot kasutamisel. Eelduseks on , et operatsioonisüsteemis on LVM tugi olemas (reeglina on see nii paratamatult) ning seda kasutatakse andmebaasi failisüsteem all, nt nii

# df -h
Filesystem                                           Size  Used Avail Use% Mounted on
..
/dev/mapper/pgdata-data_postgresql                   158G  135G   16G  90% /var/lib/postgresql
/dev/mapper/pgdata-data_backup                        36G   25G  9.2G  73% /data/backup

LVM snapshot kasutamine annab võimaluse kasutada ajahetkel vastavat baasi seisu nö lühiajaliseks katseks (ajalise kestuse võimaluse määrab LVM snapshotile eraldatud mahu ressursi suurus; nb! kui näidatud maht saab täis jääb baas seisma ja enam andmetele vähemalt kergesti ligi ei pääse)

peatada baasi protsessid
ühendada lahti /var/lib/postgresql failisüsteem
tekitada snapshot

# lvcreate -L 40G -s -n data_postgresql_20150326_tootanud /dev/pgdata/data_postgresql

ühendada snapshot failisüsteem /var/lib/postgresql alla

# mount /dev/pgdata/data_postgresql_20150326_tootanud /var/lib/postgresql

käitada baasi protsessid

Peale katse lõppu

peatada protsessid
ühendada snapshoti failisüsteem lahti
kustutada snapshot

# lvremove /dev/pgdata/data_postgresql_20150326_tootanud

ühedada algne failisüsteem külge
käivitada protsessid

Lisaks on võimalus käivitada kaks PostgreSQL eksemplari paraleelselt, selleks tuleb tekida snapshot nagu kirjeldatud, käivitada tagasi originaal ning valmistada ette teise (st snapshotilt töötava) andmebaasi eksemplari seadistused

# cp -a /etc/postgresql/9.4/main /etc/postgresql/9.4/test

ning kohendada postgresql.conf seadistusfailis parameetreid

data kataloog
pid fail
archive log välja lülitada
logi kataloog
port - nt 5433
ressursikasutus üle vaadata (shared_buffers, max_connections)

nt selliselt

# diff /etc/postgresql/9.4/main/postgresql.conf /etc/postgresql/9.4/test/postgresql.conf
< data_directory = '/var/lib/postgresql/9.4/main'
---
> data_directory = '/var/lib/postgresql/9.4/test'

< hba_file = '/etc/postgresql/9.4/main/pg_hba.conf'
---
> hba_file = '/etc/postgresql/9.4/test/pg_hba.conf'

< ident_file = '/etc/postgresql/9.4/main/pg_ident.conf'
---
> ident_file = '/etc/postgresql/9.4/test/pg_ident.conf'

< external_pid_file = '/var/run/postgresql/9.4-main.pid'
---
> external_pid_file = '/var/run/postgresql/9.4-test.pid'

< port = 5432
< max_connections = 100
---
> port = 5433
> max_connections = 30

< shared_buffers = 2GB
---
> shared_buffers = 384MB

< archive_mode = off
---
> # archive_mode = off
 
< stats_temp_directory = '/var/run/postgresql/9.4-main.pg_stat_tmp'
---
> stats_temp_directory = '/var/run/postgresql/9.4-test.pg_stat_tmp'

ühendada külge sobivasse punkti failisüsteemis, nt

# mkdir /var/lib/postgresql/9.2/test
# mount /dev/pgdata/data_postgresql_20150326_tootanud /var/lib/postgresql/9.2/test

ning käivitada teine eksemplar

# pg_ctlcluster 9.4 test start

Tulemusena on kaks eksemplari

# pg_lsclusters 
Ver Cluster    Port Status Owner    Data directory                  Log file
9.2 main       5432 online postgres /var/lib/postgresql/9.2/main    /var/log/postgresql/postgresql-%Y-%m-%d_%H%M%S.log
9.2 test       5433 online postgres /var/lib/postgresql/9.2/test    /var/log/postgresql-test/postgresql-%Y-%m-%d_%H%M%S.log

Kui LVM snapshot tehti töötavast andmeklastri kataloogist, siis saab käivitamisel sellise veateate

# pg_ctlcluster 9.2 test start
Cluster is already running.

Teda segab selline fail, mis tuleb eemaldada

# cat /var/lib/postgresql/9.2/test/postmaster.pid 
2025
/var/lib/postgresql/9.2/main
1473969248
5432
/var/run/postgresql

NFS kasutamine PostgreSQL andmebaasiga

PostgreSQL töötab põhimõtteliselt ilusti üle NFS külge ühendatud failisüsteemiga. Seejuures tuleb muidugi arvestada, et NFS ressursi jõudlus ei ole tingimata selliste omadustega nagu lokaalne või FC ressurss. NFS ja LVM kombineerimine eemaldab eelmises punktis kirjeldatud tegevustelt samas arvutis töötamise piirangu. St võimalik on LVM snapshotilt käivitada andmebaas teises arvutis. Selleks tuleb

moodustada LVM snaphost
snapshot failisüsteem ühendada külge nagu kirjeldatud eelmises punktis (NB! mitte käivitada lokaalselt sealt protsesse, vastasel juhul tekib konflikt kuna samu andmebaasi faile kasutatakse kahest arvutist sõltumatult)
Seejärel tuleb jagada snapshoti failisüsteem välja NFS serveris (10.100.13.159 on NFS klient)

# cat /etc/exports
/var/lib/postgresql/9.2/test      10.100.13.159(rw,sync,no_subtree_check)

ning öelda

# /etc/init.d/nfs-kernel-server reload

kliendi arvutis külge ühendada (10.100.13.174 on NFS server)

# mount 10.100.13.174:/var/lib/postgresql/9.2/test /var/lib/postgresql/9.2/test

edasi kasutada sarnaselt kui eelmises punktis teist eksemplari

LVM ja NFS kasutamine PostgreSQL andmebaasiga

Kahe eelmise punkti üks variantsioon on võimalus mugavalt läbi proovida andmebaasi versiooni uuendamist pg_upgrade utiliidi abil. St teises arvutis on siis olemas

snapshotilt tulev vana baasi failisüsteem üle NFS
peab olema vana baasi versioonile vastav tarkvara paigaldatud lokaalselt (nt v. 8.4)
uue baasi versiooni tarkvara paigaldatud lokaalselt (nt v. 9.4)

Ja tulemusena peab saama öelda nö

$ /usr/lib/postgresql/9.4/bin/pg_upgrade -b /usr/lib/postgresql/8.4/bin -B /usr/lib/postgresql/9.4/bin -d /var/lib/postgresql/8.4/test \
  -D /var/lib/postgresql/9.4/test -p 5432 -P 5433 -o ' -D /etc/postgresql/8.4/test' -O ' -D /etc/postgresql/9.4/test' -c

Andmebaasi vigade parandamine

XXX viga

Probleemiks on baasi dump käigus tekkiv viga

$ pg_dump -p 5435 -Fc -f baasinimi.dump baasinimi
pg_dump: Dumping the contents of table "failid" failed: PQgetResult() failed.
pg_dump: Error message from server: ERROR:  unexpected chunk number 570 (expected 568) for toast value 241844880 in pg_toast_62025918
pg_dump: The command was: COPY public.failid (faili_id, yhistu_id, perioodi_id, arve_id, dokumendi_id, ...) TO stdout;

Tööpõhimõte

TODO

failid2 tabeli tekitamiseks sobib öelda (nb! ei tekitata constrainitisid jms)

baasinimi=# select * into failid2 from failid limit 1;
baasinimi=# delete from failid2;

Vigaste kirjete leidmine

-- FUNCTION: public.imre10(integer, integer)

-- DROP FUNCTION public.imre10(integer, integer);

CREATE OR REPLACE FUNCTION public.imre10(
	integer,
	integer)
    RETURNS character varying
    LANGUAGE 'plpgsql'

    COST 100
    VOLATILE 
AS $BODY$
DECLARE
    badid INT;
	vfaili_id integer;
	vyhistu_id integer;
	vperioodi_id integer;
	varve_id integer;
	vdokumendi_id integer;
        ...
	loc varchar;
BEGIN
FOR badid IN SELECT faili_id FROM failid LOOP
    BEGIN
        select faili_id into vfaili_id FROM failid where faili_id = badid;
        select yhistu_id into vyhistu_id FROM failid where faili_id = badid;
	select perioodi_id into vperioodi_id FROM failid where faili_id = badid;
	select arve_id into varve_id FROM failid where faili_id = badid;
	select dokumendi_id into vdokumendi_id from failid where faili_id = badid;
        ...
	insert into failid2 (faili_id, yhistu_id, arve_id, dokumendi_id, ...) values (vfaili_id, vyhistu_id, varve_id, vdokumendi_id, ...);
        -- RAISE NOTICE 'Hello World %', badid::int;
    EXCEPTION
        WHEN OTHERS THEN
           RAISE NOTICE 'Data for ID % is corrupt', badid;
           CONTINUE;
    END;
END LOOP;
return 'tere';
END;
$BODY$;

ALTER FUNCTION public.imre10(integer, integer)
    OWNER TO imre;

käivitamiseks

baasinimi=# select imre10(1, 1);
NOTICE:  Data for ID 2594124 is corrupt
NOTICE:  Data for ID 2594125 is corrupt
 imre10
--------
 tere
(1 row)

Vigaste kirjete kustutamiseks

baasinimi=# select * from failid where faili_id = '2594124';
ERROR:  unexpected chunk number 570 (expected 568) for toast value 241844880 in pg_toast_62025918
baasinimi=# select * from failid where faili_id = '2594125';
ERROR:  unexpected chunk number 62 (expected 60) for toast value 241844882 in pg_toast_62025918

baasinimi=# delete from failid where faili_id = '2594124';
DELETE 1
baasinimi=# delete from failid where faili_id = '2594125';
DELETE 1

Kasulikud lisamaterjalid

https://www.postgresql.org/message-id/CACut7uSkZrpFHtDEq6UCoOd5fMpXDvmhzGSh=ZHJx86Ac=nOUg@mail.gmail.com

Misc

postgres=# table pg_hba_file_rules;
 line_number | type  |   database    | user_name  |  address  |                 netmask                 | auth_method | options | error 
-------------+-------+---------------+------------+-----------+-----------------------------------------+-------------+---------+-------
          85 | local | {all}         | {postgres} |           |                                         | peer        |         | 
          90 | local | {all}         | {all}      |           |                                         | peer        |         | 
          92 | host  | {all}         | {all}      | 127.0.0.1 | 255.255.255.255                         | md5         |         | 
          94 | host  | {all}         | {all}      | 0.0.0.0   | 0.0.0.0                                 | md5         |         | 
          97 | local | {replication} | {all}      |           |                                         | peer        |         | 
          98 | host  | {replication} | {all}      | 127.0.0.1 | 255.255.255.255                         | md5         |         | 
          99 | host  | {replication} | {all}      | ::1       | ffff:ffff:ffff:ffff:ffff:ffff:ffff:ffff | md5         |         | 
(7 rows)

2026 kevade märkused

lähtepunktiks on töötav debian v. 11 ja pgdg v. 15 postgresql andmebaas, pgbackrest on kasutusel varundamiseks ssh serverisse, zabbix agent2
disableda systemd abil postgresql ja postgresql@15-main, /etc/fstab kommenteerida välja '/var/lib/postgresql', virtuaalse pve arvuti shutdown ja teha pbs varundus mitte-töötavast arvutist
eemaldada zabbix-agent2 pakett
arvuti käivitada ja uuendada 11 -> 12 -> 13 debian operatsioonisüsteem ja pgdg tarkvara (muutes bullseye -> bookworm -> trixie apt sources konfis)
veenduda et /etc/postgresql-common/pgcreatecluster.d/moraal.conf on sobiva sisuga, vt all pool
paigaldada postgresql-18 pakett
monteerida külge '/var/lib/postgresql'
teha igaks juhuks koopia /var/lib/postgreql/15/main kataloogist
käivitada uuendatud olukorras postgresql v. 15 ja korrigeerida libc uuendusest tulenevad probleemid, vt all pool
uuendada postgresql andmestik pg_clusterupgrade abil 15 -> 18, analyze jne (pg_clusterupgrade väljund õpetab)
enableda systemd abil postgresql ja postgresql@18-main
paigaldada zabbix-agent2 pakett (seejuures vist tekib automaatselt pinning /etc/apt/preferences.d/zabbix abil repo.zabbix.com peale või versioonile)

pg v. 15 all Debian v 11 -> v 13 uuendamine

Käesolev punkt ei tegele postgresql tarkvara enda uuendamisega, aga postgresqli sama versiooni mõjutava libc uuenduse mõjuga, Debian v 11 puhul

# dpkg -l libc6 | grep ^ii
ii  libc6:amd64    2.31-13+deb11u13 amd64        GNU C Library: Shared libraries

ja Debian v 13 puhul

# dpkg -l libc6 | grep ^ii
ii  libc6:amd64    2.41-12+deb13u2 amd64        GNU C Library: Shared libraries

probleem paistab välja logis nii

2026-05-12 23:05:36.689 EEST [3152] LOG:  starting PostgreSQL 15.17 (Debian 15.17-1.pgdg13+1) on x86_64-pc-linux-gnu, compiled by gcc (Debian 14.2.0-19) 14.2.0, 64-bit
2026-05-12 23:05:36.690 EEST [3152] LOG:  listening on IPv4 address "0.0.0.0", port 5432
2026-05-12 23:05:36.690 EEST [3152] LOG:  listening on IPv6 address "::", port 5432
2026-05-12 23:05:36.691 EEST [3152] LOG:  listening on Unix socket "/var/run/postgresql/.s.PGSQL.5432"
2026-05-12 23:05:36.697 EEST [3155] LOG:  database system was shut down at 2026-05-12 22:18:29 EEST
2026-05-12 23:05:36.707 EEST [3152] LOG:  database system is ready to accept connections
2026-05-12 23:05:37.748 EEST [3162] postgres@template1 WARNING:  database "template1" has a collation version mismatch
2026-05-12 23:05:37.748 EEST [3162] postgres@template1 DETAIL:  The database was created using collation version 2.31, but the operating system provides version 2.41.
2026-05-12 23:05:37.748 EEST [3162] postgres@template1 HINT:  Rebuild all objects in this database that use the default collation and run ALTER DATABASE template1 REFRESH COLLATION VERSION, or build PostgreSQL with the right library version.
2026-05-12 23:05:38.265 EEST [3165] postgres@template1 WARNING:  database "template1" has a collation version mismatch
2026-05-12 23:05:38.265 EEST [3165] postgres@template1 DETAIL:  The database was created using collation version 2.31, but the operating system provides version 2.41.
...

postgres@test-db:~$ psql
WARNING:  database "postgres" has a collation version mismatch
DETAIL:  The database was created using collation version 2.31, but the operating system provides version 2.41.
HINT:  Rebuild all objects in this database that use the default collation and run ALTER DATABASE postgres REFRESH COLLATION VERSION, or build PostgreSQL with the right library version.
psql (18.3 (Debian 18.3-1.pgdg13+1), server 15.17 (Debian 15.17-1.pgdg13+1))
Type "help" for help.

kus

andmebaas kurdab, et binary data on tekitqtud libc v. 2.31 koosseisus oleva collationi abil ja praegu süsteem kasutab libc v. 2.41

lahendus

postgres@test-db:~$ reindexdb --all 1> reindexdb-all.log 2>&1

postgres@test-db:~$ psql
psql (15.17 (Debian 15.17-1.pgdg13+1))
Type "help" for help.

postgres=# ALTER DATABASE "template1" REFRESH COLLATION VERSION;
postgres=# ALTER DATABASE "db_infosysteem" REFRESH COLLATION VERSION;
postgres=# ALTER DATABASE "postgres" REFRESH COLLATION VERSION;

kus

reindexdb on käsk mis tuleb anda töötava baasi suhtes (mitte failisüsteemis lebavate binary data failide suhtes)
pigem mitte kasutada reindexdb concurrency võimalusi (tundub, et ta ei tööta teatud tabelitega vms, tekitab .ccnew nimelisi laokile jäävaid indekseid; samas teadlikult kasutades võib olla abi)
reindex muudab andmeid
alter database .. refresh collation muudab nö raamatupidamist (tehniliselt saaks teha näiliselt baasi korda ka ilma reindex käsku ütlemata, aga küllap loodus sekkub varsti sel juhul)

Tulemuse kontrollimine, veenduda, et pole katkisi indekseid

postgres=# SELECT relname as index_name
FROM pg_class c
JOIN pg_index i ON c.oid = i.indexrelid
WHERE i.indisvalid = false;
 index_name
------------
(0 rows)

ning, et peale muudatusi on datcollversion sobiva väärtusega (uuemaga kui enne muudatust, näiteks)

postgres=# SELECT datname, datcollversion FROM pg_database;
         datname          | datcollversion
--------------------------+----------------
 template0                |
 template1                | 2.41
 db_infosysteem           | 2.41
 postgres                 | 2.41
(4 rows)

PostgreSQL v 15 -> v 18 uuendamine

Käesolev punkt tegeleb postgresql tarkvara enda uuendamisega. Üldised ettevalmistused, lülitada välja pgbackrest varundamine selleks, et olemasolevat varundust mitte eksitada

# cat /etc/postgresql/15/main/postgresql.conf
..
archive_mode=off
archive_command='/usr/bin/true'
...

ning

# cat /etc/postgresql-common/createcluster.conf.d/moraal.conf

..
create_main_cluster = false
initdb_options = '--locale=et_EE.UTF-8 --data-checksums'
...

Uuendamise käsundamine

$ pg_upgradecluster -m upgrade -v 18 15 main
$ /usr/lib/postgresql/18/bin/vacuumdb --all --analyze-in-stages
$ /usr/lib/postgresql/18/bin/vacuumdb --all --analyze-only

pgbackrest seadistamine

TODO

locale provider - libc

collate tegeleb kahes dimensioonis

sorteerimise tulemus st andmete järjestus
sorteerimise efektiivsus st on-disk indeksid

create database 'lc_collate' omab vaikimisi mõju kahes kohas

indeksi moodustamisel 'CREATE INDEX idx_users_en ON users (username COLLATE "en_US.utf8");' saab 'collate ...' ära jätta ja tulemus on sama
select päringu tegemisel 'SELECT username FROM users ORDER BY username COLLATE "en_US.utf8";' saab 'collate ...' ära jätta ja tulemus on sama

Väited

libc puhul saab teha tabeli tulbale indekseid erinevate collate'dega st erinevate keelte kohta

postgres=# CREATE DATABASE db_imretest_libc_en_us_utf_8 LOCALE_PROVIDER = 'libc' LC_COLLATE = 'en_US.UTF-8' LC_CTYPE = 'en_US.UTF-8';
CREATE DATABASE
postgres=# \l db_imretest_libc_en_us_utf_8
List of databases
-[ RECORD 1 ]-----+-----------------------------
Name              | db_imretest_libc_en_us_utf_8
Owner             | postgres
Encoding          | UTF8
Locale Provider   | libc
Collate           | en_US.UTF-8
Ctype             | en_US.UTF-8
Locale            |
ICU Rules         |
Access privileges |

postgres=# \c db_imretest_libc_en_us_utf_8
You are now connected to database "db_imretest_libc_en_us_utf_8" as user "postgres".
db_imretest_libc_en_us_utf_8=# CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    username VARCHAR(100) NOT NULL
);
CREATE TABLE
db_imretest_libc_en_us_utf_8=# INSERT INTO users (username) VALUES
('Zernask'),
('Škerin'),
('Smirnov'),
('Sébastien'),
('Sebastien'),
('Müller'),
('Muller');
INSERT 0 7
db_imretest_libc_en_us_utf_8=# SELECT username FROM users ORDER BY username COLLATE "en_US.utf8";
-[ RECORD 1 ]-------
username | Muller
-[ RECORD 2 ]-------
username | Müller
-[ RECORD 3 ]-------
username | Sebastien
-[ RECORD 4 ]-------
username | Sébastien
-[ RECORD 5 ]-------
username | Škerin
-[ RECORD 6 ]-------
username | Smirnov
-[ RECORD 7 ]-------
username | Zernask

db_imretest_libc_en_us_utf_8=# SELECT username FROM users ORDER BY username COLLATE "C.utf8";
-[ RECORD 1 ]-------
username | Muller
-[ RECORD 2 ]-------
username | Müller
-[ RECORD 3 ]-------
username | Sebastien
-[ RECORD 4 ]-------
username | Smirnov
-[ RECORD 5 ]-------
username | Sébastien
-[ RECORD 6 ]-------
username | Zernask
-[ RECORD 7 ]-------
username | Škerin

db_imretest_libc_en_us_utf_8=# CREATE INDEX idx_users ON users (username);
CREATE INDEX

db_imretest_libc_en_us_utf_8=# CREATE INDEX idx_users_en ON users (username COLLATE "en_US.utf8");
CREATE INDEX
db_imretest_libc_en_us_utf_8=# CREATE INDEX idx_users_c ON users (username COLLATE "C.utf8");
CREATE INDEX

Näide

postgres=# CREATE DATABASE db_imretest_libc_en_us_utf_8 LOCALE_PROVIDER = 'libc' LC_COLLATE = 'en_US.UTF-8' LC_CTYPE = 'en_US.UTF-8';
postgres=# CREATE DATABASE db_imretest_libc_et_ee_utf_8 LOCALE_PROVIDER = 'libc' LC_COLLATE = 'et_EE.UTF-8' LC_CTYPE = 'et_EE.UTF-8' template=template0;

postgres=# \c db_imretest_libc_en_us_utf_8;
db_imretest_libc_en_us_utf_8=# CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    username VARCHAR(100) NOT NULL
);
CREATE TABLE
db_imretest_libc_en_us_utf_8=# INSERT INTO users (username) VALUES
('Zernask'),
('Škerin'),
('Smirnov'),
('Sébastien'),
('Sebastien'),
('Müller'),
('Muller');

db_imretest_libc_en_us_utf_8=# \c db_imretest_libc_et_ee_utf_8;
You are now connected to database "db_imretest_libc_et_ee_utf_8" as user "postgres".
db_imretest_libc_et_ee_utf_8=# CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    username VARCHAR(100) NOT NULL
);
CREATE TABLE
db_imretest_libc_et_ee_utf_8=# INSERT INTO users (username) VALUES
('Zernask'),
('Škerin'),
('Smirnov'),
('Sébastien'),
('Sebastien'),
('Müller'),
('Muller');
INSERT 0 7

db_imretest_libc_et_ee_utf_8=# SELECT username FROM users ORDER BY username;
 username
-----------
 Muller
 Müller
 Sebastien
 Sébastien
 Smirnov
 Škerin
 Zernask
(7 rows)

db_imretest_libc_et_ee_utf_8=# \c db_imretest_libc_en_us_utf_8;
You are now connected to database "db_imretest_libc_en_us_utf_8" as user "postgres".
db_imretest_libc_en_us_utf_8=# SELECT username FROM users ORDER BY username;
 username
-----------
 Muller
 Müller
 Sebastien
 Sébastien
 Škerin
 Smirnov
 Zernask
(7 rows)

locale provider - icu

Mõisted

ICU - International Components for Unicode
CLRD - Common Locale Data Repository

Misc

collate - ei ole väga tavakõne sõna inglise keeles, aga tähendab järjestamist, organiseerimist jms
lc_collate ja lc_ctype puudutavad füüsiliselt on-disk andmeid
lc_messages, lc_monetary, lc_numeric, lc_time - on on-fly teisendused

Paketihalduses paistavad asjasse puutuvad sellised paketid

libicu72 - Debian v. 12
libicu76 - Debian v. 13
libicu70 - Ubuntu 22.04
libicu74 - Ubuntu 24.04
libicu78 - Ubuntu 26.04
postgresql-17-icu-ext - Debian v. 13 non-pgdg

Kasutamine

Kõige üldisem oleks esitada locale provider info 'icu' osas postgresql-common osakonnas, nt

root@ns-pg-01:~# cat /etc/postgresql-common/createcluster.d/moraal.conf
initdb_options = '--data-checksums --locale-provider=icu --icu-locale=en-US'
create_main_cluster = false

ning

root@ns-pg-01:~# pg_createcluster 16 main

Tulemusena

postgres@ns-pg-01:~$ psql
psql (16.14 (Ubuntu 16.14-1.pgdg26.04+1))
Type "help" for help.

...

postgres=# CREATE DATABASE db_pdns owner=pdns;
postgres=# CREATE DATABASE db_pda owner=pda;

postgres=# \l
                                                       List of databases
   Name    |  Owner   | Encoding | Locale Provider |   Collate   |    Ctype    | ICU Locale | ICU Rules |   Access privileges
-----------+----------+----------+-----------------+-------------+-------------+------------+-----------+-----------------------
 db_pda    | pda      | UTF8     | icu             | en_US.UTF-8 | en_US.UTF-8 | en-US      |           |
 db_pdns   | pdns     | UTF8     | icu             | en_US.UTF-8 | en_US.UTF-8 | en-US      |           |
 postgres  | postgres | UTF8     | icu             | en_US.UTF-8 | en_US.UTF-8 | en-US      |           |
 template0 | postgres | UTF8     | icu             | en_US.UTF-8 | en_US.UTF-8 | en-US      |           | =c/postgres          +
           |          |          |                 |             |             |            |           | postgres=CTc/postgres
 template1 | postgres | UTF8     | icu             | en_US.UTF-8 | en_US.UTF-8 | en-US      |           | =c/postgres          +
           |          |          |                 |             |             |            |           | postgres=CTc/postgres
(5 rows)

kus

kõik andmebaasid/templated/jne kasutavad ühetaoliselt 'locale provider' icu

sissekande tekitab, eeldusel, et 'dpkg-reconfigure locales' -> et_EE.UTF-8 on olemas ja baasi protsessidele on restart öeldud

postgres=# CREATE DATABASE db_tmp_et WITH LOCALE_PROVIDER = 'icu' ICU_LOCALE = 'et-EE' TEMPLATE = template0 LC_COLLATE = 'et_EE.UTF-8' LC_CTYPE = 'et_EE.UTF-8'

postgres=# \l db_tmp_et
List of databases
-[ RECORD 1 ]-----+------------
Name              | db_tmp_et
Owner             | postgres
Encoding          | UTF8
Locale Provider   | icu
Collate           | et_EE.UTF-8
Ctype             | et_EE.UTF-8
ICU Locale        | et-EE
ICU Rules         |
Access privileges |

Misc

postgres=# \dOS+
                                                                                      List of collations
   Schema   |          Name          | Provider |  Collate   |   Ctype    |      Locale      | ICU Rules | Deterministic? | Description
------------+------------------------+----------+------------+------------+------------------+-----------+----------------+--------------------------
 pg_catalog | C                      | libc     | C          | C          |                  |           | yes            | standard C collation
 pg_catalog | C.utf8                 | libc     | C.utf8     | C.utf8     |                  |           | yes            |
 pg_catalog | POSIX                  | libc     | POSIX      | POSIX      |                  |           | yes            | standard POSIX collation
 pg_catalog | af-NA-x-icu            | icu      |            |            | af-NA            |           | yes            | Afrikaans (Namibia)
 pg_catalog | af-ZA-x-icu            | icu      |            |            | af-ZA            |           | yes            | Afrikaans (South Africa)
 pg_catalog | af-x-icu               | icu      |            |            | af               |           | yes            | Afrikaans
 pg_catalog | agq-CM-x-icu           | icu      |            |            | agq-CM           |           | yes            | Aghem (Cameroon)
 pg_catalog | agq-x-icu              | icu      |            |            | agq              |           | yes            | Aghem
 pg_catalog | ak-GH-x-icu            | icu      |            |            | ak-GH            |           | yes            | Akan (Ghana)
 pg_catalog | ak-x-icu               | icu      |            |            | ak               |           | yes            | Akan
 pg_catalog | am-ET-x-icu            | icu      |            |            | am-ET            |           | yes            | Amharic (Ethiopia)
 pg_catalog | am-x-icu               | icu      |            |            | am               |           | yes            | Amharic
 pg_catalog | ar-001-x-icu           | icu      |            |            | ar-001           |           | yes            | Arabic (world)
...

ja

postgres@ph-minio-01:~$ psql
psql (17.9 (Debian 17.9-0+deb13u1))
Type "help" for help.

postgres=# \l+
                                                                                       List of databases
   Name    |  Owner   | Encoding | Locale Provider |   Collate   |    Ctype    | Locale | ICU Rules |   Access privileges   |  Size   | Tablespace |                Description
-----------+----------+----------+-----------------+-------------+-------------+--------+-----------+-----------------------+---------+------------+--------------------------------------------
 postgres  | postgres | UTF8     | libc            | en_US.UTF-8 | en_US.UTF-8 |        |           |                       | 894 MB  | pg_default | default administrative connection database
 template0 | postgres | UTF8     | libc            | en_US.UTF-8 | en_US.UTF-8 |        |           | =c/postgres          +| 7353 kB | pg_default | unmodifiable empty database
           |          |          |                 |             |             |        |           | postgres=CTc/postgres |         |            |
 template1 | postgres | UTF8     | libc            | en_US.UTF-8 | en_US.UTF-8 |        |           | =c/postgres          +| 7425 kB | pg_default | default template for new databases
           |          |          |                 |             |             |        |           | postgres=CTc/postgres |         |            |
(3 rows)

Uuemal ajal seadistustes puuduvad lc_ctype ja lc_collate (alatest v. 16)

postgres@ph-minio-01:~$ psql -c "SHOW ALL" | grep lc_
 lc_messages                                 | en_US.UTF-8                             | Sets the language in which messages are displayed.
 lc_monetary                                 | en_US.UTF-8                             | Sets the locale for formatting monetary amounts.
 lc_numeric                                  | en_US.UTF-8                             | Sets the locale for formatting numbers.
 lc_time                                     | en_US.UTF-8                             | Sets the locale for formatting date and time values.

Järjestused, 'locale provider = icu' ja 'icu locale = und' 'create database' moodustamine

# CREATE DATABASE db_imretest_02
    WITH
    LOCALE_PROVIDER = 'icu'
    ICU_LOCALE = 'und'  -- The universal Unicode Root Locale!
    TEMPLATE = template0;
CREATE DATABASE
#

postgresql icu extension kasutamine

db_imretest_02=# create extension icu_ext;
CREATE EXTENSION

db_imretest_02=# SELECT icu_number_spellout(1250.50, 'et');
           icu_number_spellout
------------------------------------------
 üks tuhat kakssada viiskümmend koma viis
(1 row)

db_imretest_02=# SELECT icu_format_datetime(now(), '{full}', 'et');
                     icu_format_datetime
-------------------------------------------------------------
 pühapäev, 14. juuni 2026, kell 14:52:41 Ida-Euroopa suveaeg
(1 row)

db_imretest_02=#

Tabeliga järjestusega töötamine

db_imretest_02=# CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    username VARCHAR(100) NOT NULL
);
CREATE TABLE

db_imretest_02=# INSERT INTO users (username) VALUES
('Zernask'),
('Škerin'),
('Smirnov'),
('Sébastien'),
('Sebastien'),
('Müller'),
('Muller');
INSERT 0 7
db_imretest_02=#

db_imretest_02=# SELECT username FROM users ORDER BY username COLLATE "et-EE-x-icu";
 username
-----------
 Muller
 Müller
 Sebastien
 Sébastien
 Smirnov
 Škerin
 Zernask
(7 rows)

db_imretest_02=# SELECT username FROM users ORDER BY username COLLATE "fr-FR-x-icu";
 username
-----------
 Muller
 Müller
 Sebastien
 Sébastien
 Škerin
 Smirnov
 Zernask
(7 rows)

db_imretest_02=# CREATE INDEX idx_users_universal ON users (username);
CREATE INDEX
db_imretest_02=# CREATE INDEX idx_users_estonian ON users (username COLLATE "et-EE-x-icu");
CREATE INDEX
db_imretest_02=# CREATE INDEX idx_users_french ON users (username COLLATE "fr-FR-x-icu");
CREATE INDEX

db_imretest_02=# \di
                    List of relations
 Schema |        Name         | Type  |  Owner   | Table
--------+---------------------+-------+----------+-------
 public | idx_users_estonian  | index | postgres | users
 public | idx_users_french    | index | postgres | users
 public | idx_users_universal | index | postgres | users
 public | users_pkey          | index | postgres | users
(4 rows)

libc põhise ja icu põhise lahenduse function-library call esitamine, illustreerimaks kui päring mis esitatakse on default

# SELECT username FROM users ORDER BY username;

ja

root@ph-minio-01:~# ps U postgres
    PID TTY      STAT   TIME COMMAND
    755 ?        Ss     0:00 /usr/lib/postgresql/17/bin/postgres -D /var/lib/postgresql/17/main -c config_file=/etc/postgresql/17/main/postgre
    818 ?        Ss     0:00 postgres: 17/main: checkpointer
    819 ?        Ss     0:02 postgres: 17/main: background writer
    852 ?        Ss     0:03 postgres: 17/main: walwriter
    853 ?        Ss     0:00 postgres: 17/main: autovacuum launcher
    854 ?        Ss     0:00 postgres: 17/main: logical replication launcher
   7704 pts/0    S      0:00 -bash
   7707 pts/0    S+     0:00 /usr/lib/postgresql/17/bin/psql
   7918 ?        Ss     0:00 postgres: 17/main: postgres db_imretest_01 [local] idle

root@ph-minio-01:~# ltrace -f -p 7918 2>&1 | grep --line-buffered strcoll

[pid 7918] strcoll("Zernask", "\305\240kerin")   = 1
[pid 7918] strcoll("\305\240kerin", "S\303\251bastien") = 69
[pid 7918] strcoll("Muller", "S\303\251bastien") = -2
[pid 7918] strcoll("Smirnov", "S\303\251bastien") = 69
[pid 7918] strcoll("M\303\274ller", "S\303\251bastien") = -2
[pid 7918] strcoll("Zernask", "S\303\251bastien") = 1
[pid 7918] strcoll("Sebastien", "S\303\251bastien") = -4
[pid 7918] strcoll("Sebastien", "Muller")        = 2
[pid 7918] strcoll("Sebastien", "M\303\274ller") = 2
[pid 7918] strcoll("Muller", "M\303\274ller")    = -11
[pid 7918] strcoll("Zernask", "Smirnov")         = 1
[pid 7918] strcoll("Zernask", "\305\240kerin")   = 1
[pid 7918] strcoll("Smirnov", "\305\240kerin")   = 30


root@ph-minio-01:~#
root@ph-minio-01:~# ps U postgres
    PID TTY      STAT   TIME COMMAND
    755 ?        Ss     0:00 /usr/lib/postgresql/17/bin/postgres -D /var/lib/postgresql/17/main -c config_file=/etc/postgresql/17/main/postgre
    818 ?        Ss     0:00 postgres: 17/main: checkpointer
    819 ?        Ss     0:02 postgres: 17/main: background writer
    852 ?        Ss     0:03 postgres: 17/main: walwriter
    853 ?        Ss     0:00 postgres: 17/main: autovacuum launcher
    854 ?        Ss     0:00 postgres: 17/main: logical replication launcher
   7704 pts/0    S      0:00 -bash
   7707 pts/0    S+     0:00 /usr/lib/postgresql/17/bin/psql
   7935 ?        Ss     0:00 postgres: 17/main: postgres db_imretest_02 [local] idle

root@ph-minio-01:~# ltrace -f -p 7935 2>&1 | grep --line-buffered strcoll
[pid 7935] ucol_strcollUTF8_76(0x55c2fcb7aec0, 0x55c2fcc332a0, 0xffffffff, 0x55c2fcc336a8) = 0xffffffff
^C

kus

libc põhisel juhtumil esitatakse mitu 'strcoll' library call'i
icu põhisel juhtumil esitatakse üks 'ucol_strcollUTF8_76' library call (sisemiselt küll tehakse seal mitmeid call'isid)