1940 년대와 1950년대에 디지털 컴퓨터가 처음 개발될 무렵, 여러 연구자가 기초적 추론 작업을 수행할 수 있는 프로그램을 작성하였다. 이들 중 주목할 만한 것으로는 체스 [Shannon 1950, Newell, Shaw, & Simon 1958] 나 체커 [Samuel 1959, Samuel 1967] 게임을 하거나 평면 기하학의 정리들을 증명 [Gelernter 1959] 할 수 있는 컴퓨터 프로그램을 기술한 논문들이 있다. 1956 년에는 McCarthy, Shannon이 함께 오토마타 연구라는 제목의 책을 편찬했다 [Shannon & McCarthy 1956]. 이 책에 실린 논문들이 대개 오토마타의 수학적 이론을 다루고 있는 것에 실망한 McCarthy는 1956년 Dartmouth 학술대회의 타이틀로 인공지능이라는 용어를 사용하였다. 이 학술대회에서 몇몇 중요한 초기 논문들이 발표되었는데 이들 중에는 명제 논리로 표현된 정리를 증명할 수 있는 Logic Theorist이라는 프로그램에 대한 Newell, Shaw, & Simon의 논문이 포함되어 있다 [Newell, Shaw, & Simon 1957]. 이 학문 분야에 대해 복합 정보 처리, 기계 지능, 휴리스틱 프로그래밍, 인지학 등의 명칭들이 사용되기도 하였으나 교과서, 대학 강좌, 학술대회, 학술지 등에서 많이 사용된 인공지능이라는 이름으로 자리를 잡게 되었다.
인공지능을 향한 첫걸음은 아리스토텔레스 (382~322 B.C) 가 삼단논법이라는 연역 추론 형식을 설명하고 기록한 시기까지 거슬러 올라간다. 그 후 수행된 지능을 자동화하려는 시도 중에는 오늘날 우리에게 매우 공상적인 것으로 보이는 것도 있다. 마술사이자 시인이었던 Llull (1235~1316) 은 위대한 예술작품을 뜻하는 Ars Magna 라는 바퀴들로 이루어진 기계를 만들었는데, 이는 원래 모든 질문에 대답할 수 있는 기계를 만들기 위해 시도한 것이었다. 이성을 구현하려는 탐구에 있어 과학자나 수학자들을 빼놓을 수 없다. Gardner [Martin Gardner 1982, p.3] 에 따르면 Leibniz (1646~1716) 가 처음으로 보편적 대수학에 대해 꿈꾸었다고 하는데 이를 통해 언젠가는 도덕이나 형이상학을 포함한 모든 지식을 하나의 연역적 체계 안에 포함할 수 있다고 하였다. Leibniz 는 이 체계를 철학자의 계산법 (calculus philosophicus) 또는 ratiocinator이라고 명명했는데 물론 이것은 당시의 기술 장치로는 구현할 수 없는 꿈에 지나지 않았다. 실질적 진보가 이루어지기 시작한 것은 Boole 이 명제논리의 토대를 발전시키고 난 이후이다 [Boole 1854]. Boole의 주목적은 인간 정신의 본질과 구성에 관계된 가능한 발현들의 수집이었다. 19세기 말엽에 Frege 는 기계적 추론을 위한 표기 체계를 제안했고 이를 통해 현재 우리가 술어논리 (predicate calculus)라고 알고 있는 분야 대부분이 만들어졌다 [Frege 1879]. 그는 이것을 Begriffsschrift 라고 불렀는데 번역하면 개념 기술법 (concept writing)이라는 뜻이다.
1958년에 McCarthy는 advice-taker이라고 명명한 시스템에서 지식을 표현, 사용하기 위한 언어로서 술어논리를 제안하였다 [McCarthy 1958]. 이 시스템에는 프로그램이 입력되는 것이 아니라 알아야 할 것이 무엇인지가 입력된다. Green은 이러한 생각을 QA3이라는 자신의 시스템에서 구현하고 있다 [Green 1969]. 술어논리와 이의 다양한 변형들은 인공지능 연구자들 간의 수많은 논쟁을 거쳐 입증되어 인공지능 분야에서 지식 표현을 위한 기초를 형성하고 있다.
20세기 들어 Gödel, Kleene, Post, Church, Turing 등의 논리학자들은 논리 또는 계산 시스템에서 가능한 일과 불가능한 일에 관한 많은 사실을 밝히고 형식화하였다. 보다 최근에는 Cook과 Karp 을 포함한 컴퓨터 과학자들이 이론적으로는 가능하지만, 시간과 저장 공간의 측면에서 완전히 수행 불가능한 계산 문제의 부류를 밝혀내었다.
이러한 논리학과 컴퓨터 과학의 적지 않은 연구 결과들은 연역적으로 추론할 수 없는 진리와 수행 불가능한 계산에 관한 것들이다. 몇몇 과학자들은 [Lucas 1961, Penrose 1989, Penrose 1994] 이러한 회의적 견해의 결과들을 인간의 지능이 기계화될 수 없다는 확실한 증거로 해석하였다. 그들은 기계는 계산적 한계라는 본질적 문제를 가졌지만, 인간은 이에 대해 자유롭다고 생각했다. 그러나 대부분의 논리학자와 컴퓨터 과학자들은 이러한 부정적 결과들이 인간에게는 절대 적용되지 않는 한계를 기계가 가지고 있다는 것을 의미하지는 않는다고 생각한다.
근대 이후로 인간과 유사한 지능을 기계에 구현할 가능성을 다룬 최초의 논문은 앞서 언급한 바 있는 Turing의 논문이다. [Turing 1950]. 비슷한 시기에 McCulloch 와 Pitts는 단순한 계산요소와 생물학의 신경세포 간의 관계에 대한 이론을 수립하였다 [McCulloch & Pitts 1943]. 그들은 논리소자 네트워크를 사용하여 모든 계산 가능한 함수를 구현할 수 있음을 보였다 (McCulloch-Pitts 뉴런 (neuron)을 학문적 측면에서 다룬 것으로는 [Minsky 1967] 을 참고하기 바란다). Rosenblatt 의 연구에서는 신경세포와 유사한 형태인 퍼셉트론을 학습과 패턴인식에 사용하는 것을 다루고 있다. 인공 두뇌학 (cybernetics) [Wiener 1948], 인지심리학, 계산언어학 [Chomsky 1965], 적응적 제어이론 [Widrow & Hoff 1960] 등의 여러 연구가 인공지능의 지적기반 발전에 공헌하였다.
1960~1970년대의 대부분의 초기 인공지능 연구자들은 다양한 형태의 문제 표현, 탐색 방법 등을 탐구했고 이를 간단한 수수께끼를 풀고, 게임을 하고, 정보를 찾아낼 수 있는 컴퓨터 프로그램의 작성에 이용하는 일반적 휴리스틱을 다루었다. 일반적 문제 해결사 (GPS, General Problem Solver) 는 이 부류의 주목할 만한 프로그램 중의 하나이다 [Newell, Shaw, and Simon 1959, Newell and Simon 1963]. 이러한 초기 시스템이 해결한 문제로 기호 적분 [Slagle 1963], 대수 단어 문제 [Bobrow 1968], 유추 수수께끼 [Evans 1968], 움직이는 로봇의 제어 [Nisson 1984b] 등이 있다. 이 시스템들의 상당수가 컴퓨터와 사고 (Computers and Thought) [Feigen-baum & Feldman 1963] 의 논문들이 다룬 내용을 구현한 것이다.
실제 중요한 응용 분야를 다루기 위해 확장하려는 과정에서 이러한 프로그램과 여기에 이용된 기법들이 장난감 수준의 문제만을 해결할 수 있다는 사실이 알려졌다. 더욱 강력한 시스템에서는 응용 분야에 대한 보다 다양한 지식을 저장할 필요가 있다. 1970 년대 말에서 1980년대 초에 걸쳐 진단, 설계, 분석을 포함한 여러 분야에서 인간 전문가의 작업을 모방하는 데 필요한 지식을 담고 있는 성능이 개선된 프로그램들이 개발되었다. 또한, 해당 문제 특유의 지식을 표현하는 여러 방법이 연구되었다. 화학식과 질량 스펙트럼 분석이 주어지면 유기분자의 구조를 예측하는 DENDRAL 시스템은 특정 문제 영역에 적합한 방대한 지식의 중요성을 처음으로 제시한 것으로 알려져 있다 [Feigenbaum, Buchanan, & Lederberg 1971, Lindsay, et al. 1980]. 그 밖의 여러 전문가시스템들이 잇달아 발표되었는데 그들 중에는 의학 진단 시스템 [Shortliffe 1976, Miller, Pople, & Myers 1982], 컴퓨터 시스템의 환경을 구축하거나 [McDermott 1982] 황금의 잠재적 매장량을 평가하는 시스템 [Campbell, et al. 1982, Duda Gaschnig & Hart 1979] 등이 있다. 이 시기까지의 인공지능 연구와 그 연구자에 대한 자세한 설명은 [McCorduck 1979] 에 기록되어 있다.
게임은 장난감 수준의 문제를 확장하는 데 있어 실질적 진보가 이루어진 분야 중의 하나이다. 1997 년 5월 11일 IBM에서 제작한 DEEP BLUE이라는 프로그램이 당시 세계 체스 챔피언이었던 Kasparov를 상대로 여섯 차례에 걸친 시합에서 3.5 : 2.5로 승리한 사건이 있었다. 챔피언 결정전은 매우 복잡한 탐색 알고리즘과 고성능 컴퓨터, 체스 경기를 위한 하드웨어를 사용하여 진행되었다.
인간의 지능은 시각적 장면을 인식하고 분석하는 능력, 언어를 이해하고 생성하는 능력 등을 포함하여 많은 능력을 포괄한다. 이러한 각각의 주제는 많은 주목을 받아왔다. Roberts는 초기 화면 분석 프로그램 중 하나를 개발하였다 [Roberts 1963]. 이 연구에 뒤이어 기계의 시각에 관한 많은 연구가 발표되었고 ([Nalwa 1993] 은 일반적인 내용을 다루고 있는 좋은 교과서이다), 이것은 동물의 시 지각에 관한 과학적 연구로부터 많은 영향을 받았다 [Letvinn, et al. 1959, Hubel 1988, Marr 1982]. 자연언어를 이해하는 초기의 시스템으로는 Winograd가 개발한 것이 있다 [Winograd 1972]. 1970 년대에 수행된 한 프로젝트에서는 프로토타입에 기반한 연속 음성인식 시스템이 개발되었고 Woods에 의해 개발된 LUNAR 시스템은 미항공우주국이 달에서 가져온 암석 표본에 관한 영어 질문에 대답할 수 있었다. [Woods 1973]. 오늘날에도 몇몇 자연언어 음성인식 시스템이 존재하고 있지만, 이들의 경쟁력은 특화된 문제 영역이나 어휘에 제한되고 있다. 더욱 넓은 범위를 처리하게 되기까지는 다량의 일반 상식을 표현하는 방법에 있어 많은 진보가 있어야 할 것이다. CYC 프로젝트 [Guha & Lenat 1990, Lenat & Guha 1990, Lenat 1995]에서는 이와 같은 지식의 수집, 표현을 과제 수행 목적 중 하나로 설정하고 있다.
1950년대 말 Rosenblatt 의 선진적 연구 이후 신경망에 관한 관심이 잠시 가라앉기는 했지만 1980년대 들어서면서 이에 관련된 연구가 다시 활발하게 진행되었다. 연결 강도를 조절할 수 있는 비선형 구성요소로 이루어진 네트워크는 오늘날 비선형 모델링 도구의 분야에서 중요한 요소로 여겨지고 있다. 현재 신경망은 여러 중요한 응용 프로그램에 활용되고 있다. 인공지능 연구는 신경망과 함께 생명화 접근법을 통하여 기호처리 과정을 물리적 환경 속에 있는 로봇의 센서와 작동기 (effector)에 연결하는 문제에 초점을 맞추게 되었다.
현 추세로부터 앞으로의 경향을 예측해 볼 때 통합적 자율 시스템, 즉 로봇 (robot)과 소프트봇 (softbot) 이 새로이 강조되리라 생각된다. 소프트봇 [Etzioni & Weld 1994] 은 사용자들에게 흥미로우리라 생각하는 정보를 찾아 인터넷을 돌아다니는 소프트웨어 에이전트이다. 로봇과 소프트봇의 성능을 개선하려는 시도는 미래의 인공지능 연구에 활력을 불어넣는 주도적 연구 방향으로 자리 잡게 될 것이다.