Integer

Integer [intydž^r] je v programování označení celočíselného datového typu, který představuje konečnou podmnožinu z celých čísel. Celočíselné datové typy mají v různých programovacích jazycích různou definici. Podle velikosti uložené informace (např. 16, 32 nebo 64 bitů) umožňují uchovat celé číslo z určitého intervalu a mohou (ale nemusejí) podporovat uložení znaménka (tj. záporného čísla). Hardware počítačů téměř vždy poskytuje způsob, jak reprezentovat adresu v paměti, obsah paměti nebo registr jako celé číslo.

Hodnota a její reprezentace

Hodnota položky celočíselného typu je matematické celé číslo, kterému odpovídá. Celočíselné typy mohou být bez znaménka (schopné reprezentovat pouze nezáporná celá čísla) nebo se znaménkem (schopné reprezentovat i záporná celá čísla).^[1] Znaménko je ukládáno do jednoho bitu (viz znaménkový bit).

Celočíselná hodnota se ve zdrojovém kódu programu obvykle uvádí jako posloupnost číslic, případně s předchozím + nebo −. Některé programovací jazyky umožňují jiné zápisy, například jako hexadecimální (základ 16) nebo osmičkový (základ 8). Některé programovací jazyky také povolují oddělovače skupin číslic.^[2]

Vnitřní reprezentace této hodnoty je způsob, jakým je hodnota uložena v paměti počítače. Na rozdíl od matematických čísel, hodnota v počítači má typicky nějakou minimální a maximální možnou hodnotu.

Nejčastější reprezentace kladného celého čísla je řetězec bitů, tj. pomocí binární číselné soustavy. Pořadí bajtů v paměti při ukládání se liší; viz endianita. Rozsah nebo přesnost celočíselného typu je počet bitů, které jej zastupují. Pomocí typu s n bity lze zakódovat 2ⁿ čísel; například při uložení hodnoty bez znaménka obvykle představuje nezáporné hodnoty 0 až 2ⁿ−1 (jedna z možných hodnot je nula). Jiné způsoby kódování celočíselných hodnot do bitové podoby jsou například Binárně kódovaná desítka, Grayův kód nebo kódy znaků v ASCII.

K dispozici jsou čtyři nejznámější způsoby, jak reprezentovat záporná čísla v binárním systému. Nejčastější je dvojkový doplněk, který umožňuje datovému typu integer se znaménkem a n bity reprezentovat čísla od −2⁽ⁿ⁻¹⁾ do 2⁽ⁿ⁻¹⁾−1. Aritmetika dvojkovového doplňku je výhodná, protože má dokonalou bijekci mezi reprezentací a hodnotou (zejména nerozlišuje mezi +0 a −0), a protože sčítání, odčítání a násobení nemusí rozlišovat mezi typy se znaménkem a bez znaménka. Další možnosti zahrnují binární offset, sign-magnitude a jedničkový doplněk.

Některé počítačové jazyky definují velikosti datového typu integer nezávisle na použitém počítači, jiné mají různé definice v závislosti na základní velikosti slova (word) v daném procesoru. Ne všechny jazykové implementace definují proměnné pro všechny celočíselné velikosti a definice určitých rozsahů ani nemusí být v konkrétní realizaci uvedena. Integer v jednom programovacím jazyce nemusí být stejného rozsahu (velikosti) jako v jiném jazyce nebo na jiném procesoru.

Běžné integrální datové typy

Bitů	Název	Rozsah(pro Dvojkový doplněk u záporných čísel)	Desetinných řádů (průměr.)	Použití	Implementace
Bitů	Název	Rozsah(pro Dvojkový doplněk u záporných čísel)	Desetinných řádů (průměr.)	Použití	C/C++	C#	Pascal a Delphi	Java	SQL Šablona:Cref2
4	nibble, semioctet	Se znaménkem: Od −8 do 7, od −(2³) do 2³ − 1	1	BCD, reprezentace jednoho čísla	n/a	n/a	n/a	n/a	n/a
4	nibble, semioctet	Bez znaménka: Od 0 do 15, což je 2⁴ − 1	2	BCD, reprezentace jednoho čísla	n/a	n/a	n/a	n/a	n/a
8	byte, octet	Se znaménkem: Od −128 do 127, od −(2⁷) do 2⁷ − 1	3	ASCII znaky	`int8_t`, `char`Šablona:Cref2	`sbyte`	`Shortint`	`byte`	`tinyint`
8	byte, octet	Bez znaménka: Od 0 do 255, což je 2⁸ − 1	3	ASCII znaky	`uint8_t`, `char`Šablona:Cref2	`byte`	`Byte`	n/a	`unsigned tinyint`
16	halfword, word, short	Se znaménkem: Od −32,768 do 32,767, od −(2¹⁵) do 2¹⁵ − 1	5	UCS-2 znaky	`int16_t`, `short`Šablona:Cref2, `int`Šablona:Cref2	`short`	`Smallint`	`short`	`smallint`
16	halfword, word, short	Bez znaménka: Od 0 do 65,535, což je 2¹⁶ − 1	5	UCS-2 znaky	`uint16_t`	`ushort`	`Word`	`charŠablona:Cref2`	`unsigned smallint`
32	word, long, doubleword, longword, int	Se znaménkem: Od −2,147,483,648 do 2,147,483,647, od −(2³¹) do 2³¹ − 1	10	UTF-32 znaky, Barevná hloubka s alphou, FourCC, ukazatele v 32bitovém programování	`int32_t`, `int`Šablona:Cref2, `long`Šablona:Cref2	`int`	`LongInt`; `Integer`Šablona:Cref2	`int`	`int`
32	word, long, doubleword, longword, int	Bez znaménka: Od 0 do 4,294,967,295, což je 2³² − 1	10		`uint32_t`	`uint`	`LongWord`; `DWord`; `Cardinal`Šablona:Cref2	n/a	`unsigned int`
64	word, doubleword, longword, long long, quad, quadword, qword, int64	Se znaménkem: Od −9,223,372,036,854,775,808 do 9,223,372,036,854,775,807, od −(2⁶³) do 2⁶³ − 1	19	Čas(millisekundy od Unixového času), ukazatele v 64bitovém programování	`int64_t`, `long`Šablona:Cref2, `long long`Šablona:Cref2	`long`	`Int64`	`long`	`bigint`
64		Bez znaménka: Od 0 do 18,446,744,073,709,551,615, což je 2⁶⁴ − 1	20		`uint64_t`	`ulong`	`UInt64`; `QWord`	n/a	`unsigned bigint`
128	octaword, double quadword	Se znaménkem: Od−170,141,183,460,469,231,731,687,303,715,884,105,728 do 170,141,183,460,469,231,731,687,303,715,884,105,727, od −(2¹²⁷) do 2¹²⁷ − 1	39	Složité vědecké výpočty IPv6 adresa,GUIDs	C: pouze dostupné v nestandardních knihovnách pro specifické kompilátory	n/a	n/a	n/a	n/a
128	octaword, double quadword	Bez znaménka: Od 0 do 340,282,366,920,938,463,463,374,607,431,768,211,455, což je 2¹²⁸ − 1	39	Složité vědecké výpočty IPv6 adresa,GUIDs		n/a	n/a	n/a	n/a
n	n-bit integer (general case)	Se znaménkem: (−(2ⁿ⁻¹)) do (2ⁿ⁻¹ − 1)	⌈(n − 1) log₁₀ 2⌉		Ada: `rozsah -2(n-1)..2(n-1)-1`
n	n-bit integer (general case)	Bez znaménka: 0 do (2ⁿ−1)	⌈n log₁₀ 2⌉		Ada: `rozsah 0..2n-1`, `mod 2n`; standardní knihovny nebo rozšiřující aritmetické knihovny BigDecimal nebo Decimal classes v mnoha jazycích jako Python, C++, atd.

Různé procesory podporují různé celočíselné datové typy. Typicky hardware podporuje znaménkové i bezznaménkové datové typy, ale jen v několika málo šířkách (rozsazích).

Výše uvedená tabulka uvádí šířky celočíselných typů, které jsou podporovány přímo v hardwaru běžných procesorů. Vyšší programovací jazyky poskytují více možností. Je běžné mít celočíselný typ, který má dvakrát tolik bitů než největší hardwarově podporovaný typ. Mnohé jazyky mají také typy bitových polí (určitý počet bitů, obvykle omezena tak, aby byla nižší než maximální hardwarově podporovaná šířka) a rozsahové typy (které mohou reprezentovat pouze celá čísla v zadaném rozsahu).

Některých jazyky, například Lisp, Smalltalk, REXX, Haskell, Python a Perl 6, podporují celá čísla s libovolnou přesností (známá jako celá čísla s nekonečnou přesností nebo bignums). Další jazyky, které nepodporují tento koncept jako konstrukci datových typů mohou mít knihovny, které reprezentují velmi velká čísla pomocí pole menších proměnných. Mezi ně patří knihovny jako BigInteger v Javě nebo "bigint" balíček v Perl 5.^[3] Ty pak používají k uložení čísla tolik paměti, kolik je potřeba. Nicméně, počítač má pouze omezené množství úložného prostoru, takže i ona mohou představovat jen konečnou podmnožinu matematických čísel. Tyto režimy podporu velmi velká čísla, například jeden kilobyte paměti lze použít k ukládání čísla do 2466 desetinných číslic.

Typ boolean nebo flag může představovat jen dvě hodnoty: 0 a 1, které se obvykle chápou jako nepravda (false) resp. pravda (true). Tento typ může být uložen v paměti pomocí jediného bitu, ale často využívá celý byte pro snazší adresování a rychlost přístupu.

Čtyřbitová proměnná se označuje jako nibble (menší než kousnutí, angl. bite) nebo nybble (slovní hříčka na formu slova byte). Jeden nibble odpovídá jedné číslici v šestnáctkové soustavě a představuje jednu číslici nebo kód znaménka v binární kódované dekadické soustavě.

Bajty a oktety

Termín bajt (byte) původně znamenal nejmenší adresovatelnou jednotku paměti. Byte má obvykle 8 bitů, vzácně se vyskytly i počítače s jinou šířkou bajtu, počítače, které mohly adresovat jednotlivé bity (bitově adresovaný stroj), nebo naopak skupiny po například 16 nebo 32 bitech (adresování po slovech). Termín bajt nebyl obvykle vůbec používán v souvislosti se stroji adresovanými po bitech či slovech.

Termín oktet se vždy vztahuje na rozsah 8-bitů a většinou se používá v oblasti počítačových sítí, kde umožňuje komunikaci počítačům s různými šířkami bajtu.

V moderním použití bajt téměř vždy znamená osm bitů, protože všechny ostatní velikosti se přestaly používat, takže bajt se stal synonymem pro oktet.

Slova

Výraz „slovo“ (anglicky word) se používá pro malou skupinu bitů, které procesor konkrétní architektury zpracovává najednou. Velikost slova je tedy specifická pro daný procesor. Mezi užívanými velikostmi slova byla například slova o 6, 8, 12, 16, 18, 24, 32, 36, 39, 48, 60 nebo 64 bitech. Protože je velikost slova závislá na dané architektuře, je jeho velikost obvykle stanovena prvním procesorem v dané rodině procesorů. Významy termínů odvozených od slova, jako dlouhé-slovo (longword), dvoj-slovo (doubleword), čtyř-slovo (quadword), a půl-slovo (halfword), se také mění podle použitého procesoru nebo operačního systému.^[4]

Prakticky všechny aktuální desktopové procesory (v roce 2017) jsou schopny používat 64bitová slova, i když jsou stále běžné procesory pro vestavěné systémy, které jsou 8bitové nebo 16bitové. Délka slova 36 bitů byla běžná v raných letech vývoje počítačů.

Jednou z významných příčin nekompatibilního softwaru je nesprávný předpoklad, že všechny počítače mají stejnou velikost slova, jako počítač používaný programátorem. Například pokud programátor používající jazyk C a nesprávně deklaruje proměnnou, která bude použita k uložení hodnoty větší než 2¹⁵-1, jako datový typ int, program nebude možné spustit na počítačích s 16bitovou šířkou datového typu integer. Taková proměnná by měla být deklarována jako long (který má alespoň 32 bitů na jakémkoliv počítači). Programátoři mohou také nesprávně předpokládat, že ukazatel (pointer) může být převeden na celé číslo beze ztráty informace, což mohlo fungovat na (některých) 32bitových počítačích, ale na 64bitových počítačích s 64bitovou šířkou ukazatele a 32bitovými datovými typy integer to však nefunguje.

Krátký (short) integer

Krátký (short) integer může představovat celé číslo, které potřebuje méně úložného prostoru, ve srovnání se standardním integerem na stejném stroji.

V jazyce C, je označován jako short. Je podmíněn šířkou alespoň 16 bitů a je často menší než standardní integer, ale to není nutné.^[5]^[6] Kompatibilní program může předpokládat, že lze bezpečné ukládání hodnoty mezi −(2¹⁵−1)^[7] a 2¹⁵−1,^[8] ale nesmí předpokládat že rozsah není větší. V Javě je short vždy 16bitové celé číslo. Ve Windows API je datový typ SHORT definována jako 16bitové celé číslo se znaménkem na všech strojích.^[4]

Běžné velikosti krátkého (short) integeru

Programovací jazyk	Platforma	Název datového typu	Znaménko	Rozsah v bajtech	Minimální hodnota	Maximální hodnota
C and C++	Běžná implementace	`short`	Se znaménkem	2	−32,767 ^{[pozn. 1]}	+32,767
C and C++	Běžná implementace	`unsigned short`	Bez znaménka	2	0	65,535
C#	.NET CLR/CTS	`short`	Se znaménkem	2	−32,768	+32,767
C#	.NET CLR/CTS	`ushort`	Bez znaménka	2	0	65,535
Java	Java platform	`short`	Se znaménkem	2	−32,768	+32,767

Dlouhý (long) integer

Long integer může reprezentovat celé číslo, jehož rozsah je větší nebo rovnen standardnímu integeru na stejném stroji.

V C, je označován jako long. Musí mít alespoň 32 bitů, a může nebo nemusí být větší, než je standardní integer. V kompatibilní programu, lze předpokládat, že může bezpečně ukládat hodnoty mezi −(2³¹−1)^[7] a 2³¹−1,^[8] ale nemusí předpokládat, že rozsah není větší.

Běžné rozsahy long integeru

Programovací jazyk	Typ schválení	Platforma	Název datové typu	Rozsah v bajtech	Rozsah se znaménkem	Rozsah bez znaménka
C ISO/ANSI C99	Mezinárodní standard	Unix, 16/32bitové systémy^[4] Windows, 16/32/64bitové systémy^[4]	`long`^†	4 (minimálně požaduje 4)	−2,147,483,647 do +2,147,483,647	0 do 4,294,967,295 (minimální požadavek)
C ISO/ANSI C99	Mezinárodní standard	Unix, 64bitové systémy^[4]^[6]	`long`^†	8 (minimálně požaduje 4)	−9,223,372,036,854,775,807 do +9,223,372,036,854,775,807	0 do 18,446,744,073,709,551,615
C++ ISO/ANSI	Mezinárodní standard	Unix, Windows, 16/32-bit system	`long`^†	4^[9] (minimálně požaduje 4)	−2,147,483,648 do +2,147,483,647	0 do 4,294,967,295 (minimální požadavek)
C++/CLI	Mezinárodní standard ECMA-372	Unix, Windows, 16/32-bit systems	`long`^†	4^[10] (minimálně požaduje 4)	−2,147,483,648 todo +2,147,483,647	0 do 4,294,967,295 (minimální požadavek)
VB	Standard společnosti	Windows	`Long`	4^[11]	−2,147,483,648 do +2,147,483,647	N/A
VBA	Standard společnosti	Windows, Mac OS X	`Long`	4^[12]	−2,147,483,648 do +2,147,483,647	N/A
SQL Server	St Standard společnosti	Windows	`BigInt`	8	−9,223,372,036,854,775,808 do +9,223,372,036,854,775,807	0 do 18,446,744,073,709,551,615
C#/ VB.NET	ECMA Mezinárodní standard	Microsoft .NET	`long` or `Int64`	8	−9,223,372,036,854,775,808 do +9,223,372,036,854,775,807	0 do 18,446,744,073,709,551,615
Java	Standard společnosti/ Mezinárodní standard	Java platform	`long`	8	−9,223,372,036,854,775,808 do +9,223,372,036,854,775,807	N/A
Pascal	?	Windows, UNIX	`int64`	8	−9,223,372,036,854,775,808 do +9,223,372,036,854,775,807	0 do 18,446,744,073,709,551,615(Qword typ)

^† termín long a int je ekvivalentní^[13]

Long Long

Ve C99 verzi programovacího jazyk C a C++11 verzi C++, je long long datový typ který má minimálně dvojí rozsah standardního long. Tento typ není podporován kompilátory, které vyžadují aby kód byl v souladu s předchozím C++ standardem C++03, protože v C++03 tento datový typ neexistuje. Pro ANSI/ISO kompatibilní kompilátory, jsou minimální požadavky na rozsah pro tento typ od −(2⁶³−1)^[7] do 2⁶³−1 pro typ se znaménkem a 0 2⁶⁴–1 pro typ bez znaménka^[8] . Tyto dva požadavky musí být splněny, nicméně rozšíření tohoto rozsahu je povoleno.^[14]^[15] To může vést k problémům při výměně kódu a dat mezi platformami, nebo při přímém přístup k hardwaru. Existuje několik sad záhlaví poskytujících platformně nezávislé rozsahy pro rozsahy datových typů. Standardní knihovna v C poskytuje stdint.h. Tato knihovna byla implementována v C99 a C++11.

Související články

Zobrazení záporných čísel
Binární kódované desetinné číslo, reprezentace celých čísel, běžně používané v finančních aplikacích a v databázích
Přetečení integeru
Datové typy v jazyce C

Poznámky

↑ Standard ISO C dovoluje implementacím, aby vyhradily hodnotu se znaménkovým bitem 1 a všemi ostatními 0 (pro reprezentaci znaménko-velikost a dvojkový komplement), nebo se všemi bity = 1 (pro jedničkový komplement) jako "past", hodnotu jež označuje (například) přetečení.

Reference

V tomto článku byl použit překlad textu z článku Integer (computer science) na anglické Wikipedii.

↑ CHEEVER, Eric. Representation of numbers [online]. Swarthmore College [cit. 2011-09-11]. Dostupné online.
↑ A look at Java 7's new features [online]. Dostupné online.
↑ BigInteger (Java Platform SE 6) [online]. Oracle [cit. 2011-09-11]. Dostupné online.
↑ ^a ^b ^c ^d ^e FOG, Agner. Calling conventions for different C++ compilers and operating systems: Chapter 3, Data Representation [online]. 2010-02-16 [cit. 2010-08-30]. Dostupné online.
↑ GIGUERE, Eric. The ANSI Standard: A Summary for the C Programmer [online]. 1987-12-18 [cit. 2010-09-04]. Dostupné online.
↑ ^a ^b Meyers, Randy (2000-12-01).
↑ ^a ^b ^c ISO/IEC 9899:201x [online]. open-std.org [cit. 2016-06-20]. S. section 6.2.6.2, paragraph 2. Dostupné online.
↑ ^a ^b ^c ISO/IEC 9899:201x [online]. open-std.org [cit. 2016-06-20]. S. section 5.2.4.2.1. Dostupné online.
↑ Dostupné online.
↑ Dostupné online.
↑ VB 6.0 help file
↑ Dostupné online.
↑ Dostupné online.
↑ Dostupné online.
↑ [cit. 2017-01-11]. Dostupné v archivu pořízeném dne 22-08-2010.

Sybase Adaptive Server Enterprise 15.5 : Exact Numeric Datatypes [online]. Dostupné online.
MySQL 5.6 Numeric Datatypes [online]. Dostupné online.

[9] Standard ISO C dovoluje implementacím, aby vyhradily hodnotu se znaménkovým bitem 1 a všemi ostatními 0 (pro reprezentaci znaménko-velikost a dvojkový komplement), nebo se všemi bity = 1 (pro jedničkový komplement) jako "past", hodnotu jež označuje (například) přetečení.

[1] CHEEVER, Eric. Representation of numbers [online]. Swarthmore College [cit. 2011-09-11]. Dostupné online.

[2] A look at Java 7's new features [online]. Dostupné online.

[3] BigInteger (Java Platform SE 6) [online]. Oracle [cit. 2011-09-11]. Dostupné online.

[agnerfog-4] FOG, Agner. Calling conventions for different C++ compilers and operating systems: Chapter 3, Data Representation [online]. 2010-02-16 [cit. 2010-08-30]. Dostupné online.

[c99-5] GIGUERE, Eric. The ANSI Standard: A Summary for the C Programmer [online]. 1987-12-18 [cit. 2010-09-04]. Dostupné online.

[drdobbsinteger-6] Meyers, Randy (2000-12-01).

[c-std-6.2.6.2p2-7] ISO/IEC 9899:201x [online]. open-std.org [cit. 2016-06-20]. S. section 6.2.6.2, paragraph 2. Dostupné online.

[c-std-5.2.4.2.1-8] ISO/IEC 9899:201x [online]. open-std.org [cit. 2016-06-20]. S. section 5.2.4.2.1. Dostupné online.

[10] Dostupné online.

[11] Dostupné online.

[12] VB 6.0 help file

[13] Dostupné online.

[14] Dostupné online.

[15] Dostupné online.

[16] [cit. 2017-01-11]. Dostupné v archivu pořízeném dne 22-08-2010.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[pozn. 1]

[9]

[10]

[11]

[12]

[13]

[14]

[15]