Что такое EOF и как его вызвать?

Это мой C исходный код.

Когда я собираю его в Ubuntu, он начинает получать символы, но я не знаю, как завершить программу, так как он не заканчивается вводом ENTER или возврата каретки.

Что означает EOF? Как я могу вызвать это?

Этот источник также есть в книге Денниса Ритчи:

#include <stdio.h>
    /* count digits, white space, others */
main ()
{
  int c, i, nwhite, nother;
  int ndigit[10];
  nwhite = nother = 0;
  for (i = 0; i < 10; ++i)
    ndigit[i] = 0;
  while ((c = getchar ()) != EOF)
    if (c >= '0' && c <= '9')
      ++ndigit[c - '0'];
    else if (c == ' ' || c == '\n' || c == '\t')
      ++nwhite;
    else
      ++nother;
  printf ("digits =");
  for (i = 0; i < 10; ++i)
    printf (" %d", ndigit[i]);
  printf (", white space = %d, other = %d\n", nwhite, nother);
}

3 ответа

Решение

Tl; др

Как правило, вы можете "запустить EOF" в программе, работающей в терминале с помощью нажатия клавиш CTRL+D сразу после последнего сброса ввода.


Что означает EOF? Как я могу вызвать это?

EOF означает конец файла.

"Запуск EOF" в этом случае примерно означает "информирование программы о том, что ввод больше не будет отправлен".

В этом случае, так как getchar() вернет отрицательное число, если ни один символ не прочитан, выполнение прекращается.

Но это относится не только к вашей конкретной программе, это относится ко многим различным инструментам.

В общем, "запуск EOF" может быть выполнен нажатием комбинации клавиш CTRL+D сразу после последнего сброса ввода (т. Е. Путем отправки пустого ввода).

Например с cat:

% cat >file # Hit ENTER
foo # Hit ENTER and CTRL+D
% 

Когда вы нажимаете CTRL+D, то происходит то, что ввод, введенный с момента последнего сброса ввода, сбрасывается; когда это случается пустой вход read() системный вызов вызван возвратом STDIN программы 0, getchar() возвращает отрицательное число (-1 в библиотеке GNU C), и это, в свою очередь, интерпретируется как EOF1.


1 - https://stackoverflow.com/a/1516177/4316166

TL; DR: EOF - это не символ, это макрос, используемый для оценки отрицательного возврата функции чтения ввода. Для отправки можно использовать Ctrl + D EOT символ, который заставит функцию вернуться -1

Каждый программист должен RTFM

Давайте обратимся к "Справочному руководству C A" Harbison and Steele, 4-е изд. с 1995 г., стр. 317:

Отрицательное целое число EOF - это значение, которое не является кодировкой "реального символа" .,, Например, fget (раздел 15.6) возвращает EOF в конце файла, потому что нет "реального символа" для чтения.

по существу EOF не символ, а целочисленное значение, реализованное в stdio.h представлять -1, Таким образом, ответ Коса является правильным, но речь идет не о получении "пустого" ввода. Важно отметить, что здесь EOF служит возвращаемым значением (из getchar()) сравнение, а не для обозначения фактического характера. man getchar поддерживает это:

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

fgetc(), getc() и getchar() возвращают символ, прочитанный как символ без знака, приведенный к типу int или EOF в конце файла или ошибки.

get () и fgets() возвращают s в случае успеха и NULL в случае ошибки или когда происходит конец файла, когда символы не были прочитаны.

ungetc () возвращает c в случае успеха или EOF в случае ошибки.

Рассмотрим while цикл - его основная цель - повторить действие, если условие в скобках верно. Посмотри снова:

while ((c = getchar ()) != EOF)

Это в основном говорит продолжать делать вещи, если c = getchar() возвращает успешный код (0 или выше; кстати, это обычное дело, попробуйте запустить успешную команду, затем echo $? а потом не удалось echo $? и увидеть числа, которые они возвращают). Поэтому, если мы успешно получим символ и добавим C, возвращенный код состояния будет равен 0, а ошибка - -1. EOF определяется как -1, Поэтому, когда условие -1 == -1 происходит, петли прекращаются. И когда это произойдет? Когда нет больше персонажа, чтобы получить, когда c = getchar() выходит из строя. Вы могли бы написать while ((c = getchar ()) != -1) и все равно будет работать

Кроме того, давайте вернемся к фактическому коду, вот выдержка из stdio.h

/* End of file character.
   Some things throughout the library rely on this being -1.  */
#ifndef EOF
# define EOF (-1)
#endif

Коды ASCII и EOT

Хотя символ EOF не является действительным символом, существует EOT Символ (конец передачи), который имеет десятичное значение ASCII 04; он связан с сочетанием клавиш Ctrl + D (представлен также как метасимвол ^D). Характер окончания передачи использовался для обозначения закрытия потока данных в обратном направлении, когда компьютеры использовались для управления телефонными соединениями, отсюда и название "конец передачи" .

Таким образом, можно отправить это значение ascii в программу следующим образом: $'\04' что такое EOT:

skolodya@ubuntu:$ ./a.out  <<< "a,b,c $'\04'"                                  
digits = 1 0 0 0 1 0 0 0 0 0, white space = 2, other = 9

Таким образом, мы можем сказать, что он существует, но это не для печати

Примечание

Мы часто забываем, что в прошлом компьютеры не были такими универсальными - дизайнеры должны использовать каждую доступную клавиатуру. Таким образом, отправка EOT символ с CtrlD по-прежнему "отправляет символ", в отличие от ввода заглавной буквы A, ShiftA, вы все равно заставляете компьютер вводить данные с помощью доступных клавиш. Таким образом, EOT - это реальный символ в том смысле, что он исходит от пользователя, он читается компьютером (хотя не для печати, не виден людьми), он существует в компьютерной памяти

Комментарий Byte Commander

Если вы попытаетесь прочитать из /dev/null, это также должно вернуть EOF, верно? Или что я получу там?

Да, совершенно верно, потому что в /dev/null нет фактического символа для чтения, следовательно, он c = getchar() вернусь -1 код, и программа выйдет сразу. Снова команда не возвращает EOF. EOF - это просто постоянная переменная, равная -1, которую мы используем для сравнения кода возврата функции getchar. EOF не существует как символ, это просто статическое значение внутри stdio.h,

Демо-версия:

# cat /dev/null shows there's no readable chars
DIR:/xieerqi
skolodya@ubuntu:$ cat /dev/null | cat -A        

# Bellow is simple program that will open /dev/null for reading. Note the use of literal -1                                   
   DIR:/xieerqi
skolodya@ubuntu:$ cat readNull.c                                               
#include<stdio.h>

void main()
{
   char c;
    FILE *file;
    file = fopen("/dev/null", "r");

    if (file) 
    {
    printf ("Before while loop\n");
        while ((c = getc(file)) != -1)
            putchar(c);
    printf("After while loop\n"); 
    fclose(file);
    }
}

DIR:/xieerqi
skolodya@ubuntu:$ gcc readNull.c -o readNull                                   

DIR:/xieerqi
skolodya@ubuntu:$ ./readNull
Before while loop
After while loop

Еще один гвоздь в гробу

Иногда пытаются доказать, что EOF - это символ с кодом, подобным этому:

#include <stdio.h>
int main(void)
{
    printf("%c", EOF);
    return 0;
}

Проблема в том, что тип данных char может иметь значение со знаком или без знака. Кроме того, они являются наименьшим адресуемым типом данных, что делает их очень полезными в микроконтроллерах, где память ограничена. Так что вместо того, чтобы объявить int foo = 25; это часто встречается в микроконтроллерах с небольшой памятью char foo = 25; или что-то подобное. Кроме того, символы могут быть подписаны или не подписаны.

Можно проверить, что размер в байтах с программой, как это:

#include <stdio.h>
int main(void)
{
    printf("Size of int: %lu\n",sizeof(int));
    printf("Sieze of char: %lu\n",sizeof(char));
    //printf("%s", EOF);
    return 0;
}

skolodya@ubuntu:$ ./EOF                                                        
Size of int: 4
Sieze of char: 1

Какой именно смысл? Дело в том, что EOF определяется как -1, но тип данных char может печатать целочисленные значения.

ХОРОШО.,.то, что если мы попытаемся напечатать char как строку?

#include <stdio.h>
int main(void)
{
    printf("%s", EOF);
    return 0;
}

Очевидно, ошибка, но, тем не менее, ошибка скажет нам кое-что интересное:

skolodya @ ubuntu: $ gcc EOF.c -o EOF
EOF.c: В функции 'main': EOF.c:4:5: warning: format '%s' ожидает аргумент типа 'char *', но аргумент 2 имеет тип 'int' [-Wformat=] printf("%s", EOF);

Шестнадцатеричные значения

Печать EOF в виде шестнадцатеричного значения дает FFFFFFFF, 16-битное (8-байтовое) значение, два комплимента -1,

#include <stdio.h>
int main(void)
{
    printf("This is EOF: %X\n", EOF);
    printf("This is Z: %X\n",'Z');
    return 0;
}

Выход:

DIR:/xieerqi
skolodya@ubuntu:$ ./EOF                                                        
This is EOF: FFFFFFFF
This is Z: 5A

Еще одна любопытная вещь происходит со следующим кодом:

#include <stdio.h>
int main(void)
{
   char c;
   if (c = getchar())
    printf ("%x",c);
    return 0;
}

Если нажать Shift + A, мы получим шестнадцатеричное значение 41, очевидно такое же, как в таблице ASCII. Но для Ctrl + D мы имеем ffffffff опять же - возвращаемое значение getchar() Хранится в c,

DIR:/xieerqi
skolodya@ubuntu:$ gcc  EOF.c -o ASDF.asdf                                      

DIR:/xieerqi
skolodya@ubuntu:$ ./ASDF.asdf                                                  
A
41
DIR:/xieerqi
skolodya@ubuntu:$ ./ASDF.asdf                                                  
ffffffff

Обратитесь к другим языкам

Обратите внимание, что другие языки избегают этой путаницы, потому что они работают с оценкой состояния выхода из функции, а не сравнивают ее с макросом. Как читать файл в Java?

    File inputFile  = new File (filename);
    Scanner readFile = new Scanner(inputFile);
    while (readFile.hasNext())
        { //more code bellow  }

Как насчет питона?

with open("/etc/passwd") as file:
     for line in file:
          print line

EOF обозначает конец файла. Хотя я не знаю, как вызвать следующий символ, вы можете запустить следующую программу через конвейер файла, который в конце посылает сигнал EOF:

echo "Some sample text" | ./a.out

где a.out ваш скомпилированный источник

Другие вопросы по тегам