Что такое EOF и как его вызвать?
Это мой C исходный код.
Когда я собираю его в Ubuntu, он начинает получать символы, но я не знаю, как завершить программу, так как он не заканчивается вводом ENTER или возврата каретки.
Что означает EOF? Как я могу вызвать это?
Этот источник также есть в книге Денниса Ритчи:
#include <stdio.h>
/* count digits, white space, others */
main ()
{
int c, i, nwhite, nother;
int ndigit[10];
nwhite = nother = 0;
for (i = 0; i < 10; ++i)
ndigit[i] = 0;
while ((c = getchar ()) != EOF)
if (c >= '0' && c <= '9')
++ndigit[c - '0'];
else if (c == ' ' || c == '\n' || c == '\t')
++nwhite;
else
++nother;
printf ("digits =");
for (i = 0; i < 10; ++i)
printf (" %d", ndigit[i]);
printf (", white space = %d, other = %d\n", nwhite, nother);
}
3 ответа
Tl; др
Как правило, вы можете "запустить EOF" в программе, работающей в терминале с помощью нажатия клавиш CTRL+D сразу после последнего сброса ввода.
Что означает EOF? Как я могу вызвать это?
EOF означает конец файла.
"Запуск EOF" в этом случае примерно означает "информирование программы о том, что ввод больше не будет отправлен".
В этом случае, так как getchar() вернет отрицательное число, если ни один символ не прочитан, выполнение прекращается.
Но это относится не только к вашей конкретной программе, это относится ко многим различным инструментам.
В общем, "запуск EOF" может быть выполнен нажатием комбинации клавиш CTRL+D сразу после последнего сброса ввода (т. Е. Путем отправки пустого ввода).
Например с cat:
% cat >file # Hit ENTER
foo # Hit ENTER and CTRL+D
%
Когда вы нажимаете CTRL+D, то происходит то, что ввод, введенный с момента последнего сброса ввода, сбрасывается; когда это случается пустой вход read() системный вызов вызван возвратом STDIN программы 0, getchar() возвращает отрицательное число (-1 в библиотеке GNU C), и это, в свою очередь, интерпретируется как EOF1.
TL; DR: EOF - это не символ, это макрос, используемый для оценки отрицательного возврата функции чтения ввода. Для отправки можно использовать Ctrl + D EOT символ, который заставит функцию вернуться -1
Каждый программист должен RTFM
Давайте обратимся к "Справочному руководству C A" Harbison and Steele, 4-е изд. с 1995 г., стр. 317:
Отрицательное целое число EOF - это значение, которое не является кодировкой "реального символа" .,, Например, fget (раздел 15.6) возвращает EOF в конце файла, потому что нет "реального символа" для чтения.
по существу EOF не символ, а целочисленное значение, реализованное в stdio.h представлять -1, Таким образом, ответ Коса является правильным, но речь идет не о получении "пустого" ввода. Важно отметить, что здесь EOF служит возвращаемым значением (из getchar()) сравнение, а не для обозначения фактического характера. man getchar поддерживает это:
ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ
fgetc(), getc() и getchar() возвращают символ, прочитанный как символ без знака, приведенный к типу int или EOF в конце файла или ошибки.
get () и fgets() возвращают s в случае успеха и NULL в случае ошибки или когда происходит конец файла, когда символы не были прочитаны.
ungetc () возвращает c в случае успеха или EOF в случае ошибки.
Рассмотрим while цикл - его основная цель - повторить действие, если условие в скобках верно. Посмотри снова:
while ((c = getchar ()) != EOF)
Это в основном говорит продолжать делать вещи, если c = getchar() возвращает успешный код (0 или выше; кстати, это обычное дело, попробуйте запустить успешную команду, затем echo $? а потом не удалось echo $? и увидеть числа, которые они возвращают). Поэтому, если мы успешно получим символ и добавим C, возвращенный код состояния будет равен 0, а ошибка - -1. EOF определяется как -1, Поэтому, когда условие -1 == -1 происходит, петли прекращаются. И когда это произойдет? Когда нет больше персонажа, чтобы получить, когда c = getchar() выходит из строя. Вы могли бы написать while ((c = getchar ()) != -1) и все равно будет работать
Кроме того, давайте вернемся к фактическому коду, вот выдержка из stdio.h
/* End of file character.
Some things throughout the library rely on this being -1. */
#ifndef EOF
# define EOF (-1)
#endif
Коды ASCII и EOT
Хотя символ EOF не является действительным символом, существует EOT Символ (конец передачи), который имеет десятичное значение ASCII 04; он связан с сочетанием клавиш Ctrl + D (представлен также как метасимвол ^D). Характер окончания передачи использовался для обозначения закрытия потока данных в обратном направлении, когда компьютеры использовались для управления телефонными соединениями, отсюда и название "конец передачи" .
Таким образом, можно отправить это значение ascii в программу следующим образом: $'\04' что такое EOT:
skolodya@ubuntu:$ ./a.out <<< "a,b,c $'\04'"
digits = 1 0 0 0 1 0 0 0 0 0, white space = 2, other = 9
Таким образом, мы можем сказать, что он существует, но это не для печати
Примечание
Мы часто забываем, что в прошлом компьютеры не были такими универсальными - дизайнеры должны использовать каждую доступную клавиатуру. Таким образом, отправка EOT символ с CtrlD по-прежнему "отправляет символ", в отличие от ввода заглавной буквы A, ShiftA, вы все равно заставляете компьютер вводить данные с помощью доступных клавиш. Таким образом, EOT - это реальный символ в том смысле, что он исходит от пользователя, он читается компьютером (хотя не для печати, не виден людьми), он существует в компьютерной памяти
Комментарий Byte Commander
Если вы попытаетесь прочитать из /dev/null, это также должно вернуть EOF, верно? Или что я получу там?
Да, совершенно верно, потому что в /dev/null нет фактического символа для чтения, следовательно, он c = getchar() вернусь -1 код, и программа выйдет сразу. Снова команда не возвращает EOF. EOF - это просто постоянная переменная, равная -1, которую мы используем для сравнения кода возврата функции getchar. EOF не существует как символ, это просто статическое значение внутри stdio.h,
Демо-версия:
# cat /dev/null shows there's no readable chars
DIR:/xieerqi
skolodya@ubuntu:$ cat /dev/null | cat -A
# Bellow is simple program that will open /dev/null for reading. Note the use of literal -1
DIR:/xieerqi
skolodya@ubuntu:$ cat readNull.c
#include<stdio.h>
void main()
{
char c;
FILE *file;
file = fopen("/dev/null", "r");
if (file)
{
printf ("Before while loop\n");
while ((c = getc(file)) != -1)
putchar(c);
printf("After while loop\n");
fclose(file);
}
}
DIR:/xieerqi
skolodya@ubuntu:$ gcc readNull.c -o readNull
DIR:/xieerqi
skolodya@ubuntu:$ ./readNull
Before while loop
After while loop
Еще один гвоздь в гробу
Иногда пытаются доказать, что EOF - это символ с кодом, подобным этому:
#include <stdio.h>
int main(void)
{
printf("%c", EOF);
return 0;
}
Проблема в том, что тип данных char может иметь значение со знаком или без знака. Кроме того, они являются наименьшим адресуемым типом данных, что делает их очень полезными в микроконтроллерах, где память ограничена. Так что вместо того, чтобы объявить int foo = 25; это часто встречается в микроконтроллерах с небольшой памятью char foo = 25; или что-то подобное. Кроме того, символы могут быть подписаны или не подписаны.
Можно проверить, что размер в байтах с программой, как это:
#include <stdio.h>
int main(void)
{
printf("Size of int: %lu\n",sizeof(int));
printf("Sieze of char: %lu\n",sizeof(char));
//printf("%s", EOF);
return 0;
}
skolodya@ubuntu:$ ./EOF
Size of int: 4
Sieze of char: 1
Какой именно смысл? Дело в том, что EOF определяется как -1, но тип данных char может печатать целочисленные значения.
ХОРОШО.,.то, что если мы попытаемся напечатать char как строку?
#include <stdio.h>
int main(void)
{
printf("%s", EOF);
return 0;
}
Очевидно, ошибка, но, тем не менее, ошибка скажет нам кое-что интересное:
skolodya @ ubuntu: $ gcc EOF.c -o EOF
EOF.c: В функции 'main': EOF.c:4:5: warning: format '%s' ожидает аргумент типа 'char *', но аргумент 2 имеет тип 'int' [-Wformat=] printf("%s", EOF);
Шестнадцатеричные значения
Печать EOF в виде шестнадцатеричного значения дает FFFFFFFF, 16-битное (8-байтовое) значение, два комплимента -1,
#include <stdio.h>
int main(void)
{
printf("This is EOF: %X\n", EOF);
printf("This is Z: %X\n",'Z');
return 0;
}
Выход:
DIR:/xieerqi
skolodya@ubuntu:$ ./EOF
This is EOF: FFFFFFFF
This is Z: 5A
Еще одна любопытная вещь происходит со следующим кодом:
#include <stdio.h>
int main(void)
{
char c;
if (c = getchar())
printf ("%x",c);
return 0;
}
Если нажать Shift + A, мы получим шестнадцатеричное значение 41, очевидно такое же, как в таблице ASCII. Но для Ctrl + D мы имеем ffffffff опять же - возвращаемое значение getchar() Хранится в c,
DIR:/xieerqi
skolodya@ubuntu:$ gcc EOF.c -o ASDF.asdf
DIR:/xieerqi
skolodya@ubuntu:$ ./ASDF.asdf
A
41
DIR:/xieerqi
skolodya@ubuntu:$ ./ASDF.asdf
ffffffff
Обратитесь к другим языкам
Обратите внимание, что другие языки избегают этой путаницы, потому что они работают с оценкой состояния выхода из функции, а не сравнивают ее с макросом. Как читать файл в Java?
File inputFile = new File (filename);
Scanner readFile = new Scanner(inputFile);
while (readFile.hasNext())
{ //more code bellow }
Как насчет питона?
with open("/etc/passwd") as file:
for line in file:
print line
EOF обозначает конец файла. Хотя я не знаю, как вызвать следующий символ, вы можете запустить следующую программу через конвейер файла, который в конце посылает сигнал EOF:
echo "Some sample text" | ./a.out
где a.out ваш скомпилированный источник