Kinect tuy là một sản phẩm hoàn toàn mang tính thƣơng mại nhƣng có thể xem 
nhƣ một biểu tƣợng cho sự sáng tạo và khả năng khám phá của con ngƣời trong thế kỷ
21. Nó đã mở ra một kỷ nguyên mới trong việc tƣơng tác ngƣời-máy và mở ra các 
hƣớng phát triển mới trong các lĩnh vực y tế, giáo dục, quốc phòng 
Qua câu chuyện về sự hình thành và phát triển của Kinect, chúng ta nhận thấy mọi 
điều kỳ diệu đều xuất phát từ ý tƣởng. Một ý tƣởng tốt nếu đƣợc đầu tƣ một cách đúng 
đắn sẽ từng bƣớc đi đến thành công. Bên cạnh đó, việc nghiên cứu cần có sự hỗ trợ đắc 
lực của các cá nhân, tổ chức có cùng định hƣớng nghiên cứu nhằm đạt đƣợc một mục 
đích chung. 
Với Kinect, cá nhân tiêu biểu cho sự thành công của dự án này là Kipman, ông đã 
không ngừng tìm tòi, nghiên cứu và ứng dụng các giải pháp để có lời giải cuối cùng 
cho bài toán của mình. Câu chuyện cũng cho thấy việc bồi dƣỡng các kỹ năng tƣ duy 
sáng tạo là một bƣớc tiến nhằm thay đổi các lối mòn trong suy nghĩ và đƣa chúng ta 
đến gần với những giải pháp mới để giải quyết vấn đề một cách chính xác và hoàn 
thiện hơn.
                
              
                                            
                                
            
 
            
                
22 trang | 
Chia sẻ: lylyngoc | Lượt xem: 2640 | Lượt tải: 0
              
            Bạn đang xem trước 20 trang tài liệu Tiếu luận phương pháp luận sáng tạo khoa học: quá trình hình thành và phát triển của microsoft kinect, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
 ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH 
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN 
KHOA KHOA HỌC MÁY TÍNH 
TIẾU LUẬN PHƯƠNG PHÁP LUẬN 
SÁNG TẠO KHOA HỌC: 
QUÁ TRÌNH HÌNH THÀNH 
VÀ PHÁT TRIỂN 
CỦA MICROSOFT KINECT 
 Giảng viên hướng dẫn: GS. TS. HOÀNG VĂN KIẾM 
 Học viên thực hiện: NGUYỄN PHƯƠNG ANH 
 Lớp: Cao học Khóa 6 MSHV: CH1101159 
TP. Hồ Chí Minh, tháng 04 năm 2012 
LỜI CẢM ƠN 
Em xin bày tỏ lòng biết ơn sâu sắc đến GS. TS. Hoàng Văn Kiếm, trưởng bộ 
môn Kỹ thuật phần mềm khoa Công Nghệ Phần Mềm, trường Đại học Công Nghệ 
Thông Tin, ĐHQG TP.HCM đã tận tình hướng dẫn, cung cấp kiến thức, truyền đạt 
những kinh nghiệm quí báu giúp em hoàn thành tốt bài tiểu luận này. 
Xin cám ơn cha, mẹ, các anh, chị em trong gia đình đã hỗ trợ, lo lắng và động 
viên. Đồng thời, xin cám ơn tất cả các bạn đã ủng hộ, giúp đỡ chúng tôi trong quá 
trình thực hiện bài tiểu luận này. 
 Dù đã có nhiều cố gắng nhưng chắc chắn sẽ không tránh khỏi những thiếu sót, 
em rất mong nhận được sự đóng góp ý kiến của các Thầy giáo, Cô giáo và các bạn để 
đề tài này được hoàn thiện hơn. 
 Em xin chân thành cảm ơn! 
 Tp Hồ Chí Minh, tháng 04 năm 2012 
 Học viên 
NHẬN XÉT 
(Của giảng viên hƣớng dẫn) 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
............................................................................................................................................................... 
MỤC LỤC 
LỜI NÓI ĐẦU ................................................................................................................. 1 
CHƢƠNG 1: TÌM HIỂU MICROSOFT KINECT ......................................................... 2 
1. Giới thiệu về Microsoft Kinect ............................................................................. 2 
2. Lịch sử phát triển ................................................................................................... 2 
3. Cấu trúc phần cứng của Kinect ............................................................................. 4 
4. Cấu trúc của Kinect SDK ...................................................................................... 6 
CHƢƠNG 2: CÂU CHUYỆN BÍ MẬT VỀ SỰ PHÁT TRIỂN KINECT ..................... 8 
CHƢƠNG 3: KẾT LUẬN ............................................................................................. 15 
PHỤ LỤC ...................................................................................................................... 16 
TÀI LIỆU THAM KHẢO ............................................................................................. 18 
MỤC LỤC HÌNH ẢNH 
Hình 1: Thiết bị Microsoft Kinect ................................................................................... 2 
Hình 2: Gian hàng của Microsoft tại triển lãm E3 - 2009 ............................................... 3 
Hình 3: Cấu trúc phần cứng bên trong Kinect................................................................. 4 
Hình 4: Lƣới hồng ngoại phát ra từ Kinect ..................................................................... 5 
Hình 5: Bản đồ chiều sâu của hình ảnh thu về thể hiện bằng màu gradient từ trắng(gần) 
đến xanh dƣơng(xa) ......................................................................................................... 5 
Hình 6: Microsoft Kinect sau khi đƣợc tháo rời hoàn toàn ............................................. 6 
Hình 7: Phần cứng và phần mềm của Kinect tƣơng tác với một ứng dụng .................... 6 
Hình 8: Cấu trúc ứng dụng Kinect để phát triển ứng dụng trên Kinect SDK ................. 7 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 1 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
LỜI NÓI ĐẦU 
Kể từ khi máy tính cá nhân đƣợc phát triển, máy tính đƣợc sản xuất hƣớng tới 
ngƣời dùng phổ thông nhiều hơn. Điều đó thúc đẩy tƣơng tác ngƣời-máy cũng đƣợc 
phát triển theo những hình thức ngày càng đơn giản hơn và tự nhiên hơn. Trong lịch sử 
máy tính hiện đại đã có 2 cuộc cách mạng lớn về thiết bị đã dẫn tới những thay đổi của 
tƣơng tác ngƣời-máy, và sắp tới có thể là cuộc cách mạng của thiết bị Kinect và các 
thiết bị tƣơng tự. 
Nỗ lực sớm nhất của việc thay đổi tƣơng tác ngƣời-máy là vào năm 1880, khi 
Herman Hollerith làm việc ở Cục điều tra dân số Hoa Kì, tìm cách xử lý dữ liệu dân số 
bằng máy. Kết quả là máy tính sử dụng bìa đục lỗ đã đƣợc tạo ra, đem tới một phƣơng 
thức thao tác đơn giản hơn với dữ liệu. Sau này, bàn phím tồn tại cùng với sự phát 
triển của các máy tính hiện đại. Nhƣng 2 điều vừa nêu vẫn chƣa phải là những cuộc 
cách mạng vì bìa đục lỗ quá phức tạp và thao tác với các phím mũi tên trên bàn phím 
vẫn chƣa quen thuộc với thói quen tự nhiên của con ngƣời. 
Cho tới năm 1983, chuột máy tính đầu tiên đƣợc giới thiệu cùng với máy Lisa của 
Apple. Đi kèm đó là sự xuất hiện của giao diện ngƣời dùng đồ hoạ (Graphical User 
Interface - GUI). Và đây là cuộc cách mạng đầu tiên trong tƣơng tác ngƣời-máy. Chuột 
máy tính sau đó đã trở nên không thể thiếu với hầu hết máy tính cá nhân. 
Cuộc cách mạng tiếp theo là sự phổ biến nhanh chóng và mạnh mẽ của công nghệ 
cảm ứng đa điểm, dẫn đầu bởi thiết bị di động mang tính cách mạng iPhone của Apple. 
Cảm ứng đa điểm cho phép tƣơng tác ngƣời-máy thông qua chạm và vuốt trên màn 
hình cảm ứng. Công nghệ này đã thay đổi hoàn toàn tƣ duy cũ của thời đại máy tính cá 
nhân, và đã loại bỏ hẳn bàn phím cứng trên nhiều thiết bị di động lẫn máy tính. 
Thiết bị Kinect cũng có thể là cuộc cách mạng tiếp theo. Khi Microsoft giới thiệu, 
họ coi đây là một thiết bị cách mạng trong lĩnh vực trò chơi và giải trí. Microsoft phát 
hành Kinect nhƣ là một cảm biến gắn thêm vào Xbox 360 và phát triển các game 
tƣơng tác bằng cử chỉ cơ thể trên hệ máy Xbox. Nhƣng ngay sau đó, ngƣời dùng và 
các lập trình viên thế giới đã tìm thấy sự thú vị trong việc phát triển các ứng dụng 
tƣơng tác với máy tính cá nhân sử dụng Kinect và đã bắt tay vào nghiên cứu và ứng 
dụng thiết bị này trong nhiều lĩnh vực khác nhau. 
Câu chuyện về quá trình thành và phát triển Kinect là một câu chuyện kể về sự tìm 
tòi sáng tạo, không ngừng vƣơn lên, không nản lòng khi đối mặt với khó khăn của đội 
ngũ kỹ sƣ Microsoft. Đây sẽ là một bài học bổ ích cho những cá nhân, tổ chức đang 
tham gia công tác nghiên cứu khoa học và sáng tạo. 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 2 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
CHƯƠNG 1: TÌM HIỂU MICROSOFT KINECT 
1. Giới thiệu về Microsoft Kinect: 
Hình 1: Thiết bị Microsoft Kinect 
Kinect là một thiết bị đầu vào có khả năng cảm nhận chuyển động đƣợc tạo ra bởi 
Microsoft dùng cho dòng sản phẩm chính là máy chơi game Xbox 360 và máy tính 
chạy hệ điều hành Windows. 
Kinect có thiết kế tƣơng tự một webcam và là một thiết bị ngoại vi cho máy Xbox 
360, nó cho phép ngƣời dùng điều khiển và tƣơng tác với máy Xbox 360 không cần sử 
dụng thiết bị điều khiển mà thông qua chính những chuyển động tự nhiên của cơ thể 
bao gồm cử chỉ và giọng nói. Mục đích chính của dự án này là để tăng trải nghiệm của 
ngƣời chơi khi sử dụng Xbox 360. Phiên bản dành cho hệ điều hành Windows đƣợc 
phát hành ngày 01/02/2012. 
Kinect đƣợc phát hành vào ngày 04/11/2010 tại Bắc Mỹ, 10/11/2010 tại Châu Âu, 
18/11/2010 tại Úc, New Zealand, Singapore và ngày 20/11/2010 tại Nhật Bản. Kinect 
đƣợc bán chung một gói với máy Xbox 360 và game Kinect Adventures. 
Trong 60 ngày đầu tiên, Microsoft đã bán đƣợc hơn 8 triệu sản phẩm Kinect và 
Kinect đƣợc ghi nhận vào sách kỷ lục thế giới cho danh hiệu “Sản phẩm điện tử tiêu 
dùng có tốc độ tiêu thụ nhanh nhất thế giới”. Tính đến tháng 01/2012, Microsoft đã 
bán đƣợc 18 triệu Kinect. 
Microsoft cũng đã đƣa ra bộ công cụ hỗ trợ lập trình (Software Development Kit – 
SDK) cho Kinect trên hệ điều hành Windows 7 vào ngày 16/06/2011. Bộ SDK này cho 
phép lập trình viên có thể xây dựng các ứng dụng tƣơng tác với Kinect bằng các ngôn 
ngữ C++/CLI, C# hoặc Visual Basic .NET. 
2. Lịch sử phát triển: 
Kinect lần đầu tiên đƣợc giới thiệu vào ngày 01/06/2009 tại triển lãm E3 dƣới tên 
mã là Project Natal. Theo truyền thống lấy tên thành phố để đặt tên mã của Microsoft, 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 3 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
Project Natal đƣợc lấy tên từ thành phố Natal của Brazil để ghi công Alex Kipman – 
một giám đốc của Microsoft, ngƣời đã khai sinh ra dự án và cũng là một ngƣời có gốc 
Brazil. Natal nghĩa là “một cuộc sống mới” với ngụ ý của Microsoft là “sự ra đời của 
một hệ thống giải trí gia đình mới”. 
Hình 2: Gian hàng của Microsoft tại triển lãm E3 - 2009 
Ba game đã đƣợc trình diễn tại Microsoft‟s E3 2009 Media Briefing là Ricochet, 
Paint Party và Milo & Kate. Một bản demo cho game Burnout Paradise cũng đƣợc 
trình diễn bên ngoài Microsoft‟s Media Briefing. Tại E3 2009, công nghệ nhận dạng 
khung xƣơng cho phép ghi nhận đƣợc 4 ngƣời cùng lúc với 48 điểm xƣơng trên cơ thể 
ngƣời tại mức 30Hz. 
Trong quá trình phát triển, đội phát triển đã thử nghiệm nhiều trên game khác nhau 
để nâng cao khả năng của Kinect. Tiêu biểu là Beautiful Katamari và Space Invaders 
Extreme, vốn đã đƣợc biểu diễn tại Tokyo Game Show tháng 09/2009. Giám đốc sáng 
tạo Kudo Tsunoda của Microsoft cho biết việc đƣa hệ thống điều khiển của Kinect vào 
các game cũ thông qua hệ thống cập nhật phần mềm tự động gặp rất nhiều khó khăn. 
Kinect ban đầu đƣợc thiết kế riêng một bộ vi xử lý riêng nhƣng đến tháng 01/2010, 
các thao tác xử lý đƣợc đảm nhận trực tiếp bởi một nhân của bộ vi xử lý Xbox 360′s 
Xenon CPU. Alex Kipman cho biết Kinect sẽ chiếm 10-15% tài nguyên của Xbox 360. 
Ngày 13/06/2010, Microsoft mở hội nghị “World Premiere „Project Natal‟ for the 
Xbox 360 Experience” tại Galen Center. Tại đây Project Natal đã có tên gọi chính thức 
là Kinect, vốn là sự kết hợp giữa “kinetic” (chuyển động) và “connect” (kết nối), cũng 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 4 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
chính là mục tiêu mà thiết bị hƣớng tới. Microsoft cũng đã thông báo ngày phát hành 
tại Bắc Mỹ là 4/11/2010. Và cũng tại đây, Microsoft đã giới thiệu một thiết kế mới của 
Xbox 360 tƣơng thích hoàn toàn với Kinect. 
Ngày 16/06/2011, Microsoft chính thức phát hành bộ công cụ phát triển phần mềm 
phi thƣơng mại cho Kinect. Tiếp theo, ngày 01/02/2012 Microsoft chính thức phát 
hành phiên bản thƣơng mại của bộ công cụ phát triển phần mềm Kinect cho hơn 300 
công ty của 25 nƣớc trên toàn thế giới. 
3. Cấu trúc phần cứng của Kinect: 
Hình 3: Cấu trúc phần cứng bên trong Kinect 
Kinect đƣợc tạo ra dựa trên 2 nền tảng chính bao gồm nền tảng phát triển công 
nghệ phần mềm của Rare – một nhánh của bộ phận phát triển game của Microsoft và 
công nghệ camera đo chiều sâu của hãng PrimeSense tại Israel – một hãng đã phát 
triển thành công hệ thống có khả năng hiểu đƣợc những chuyển động xác định và dùng 
nó để điều khiển các thiết bị điện tử. 
Kinect đƣợc thiết kế theo cấu trúc một thanh ngang kết nối với một trụ nhỏ bằng 
một trục cơ đứng nhằm mục đích cho phép camera có thể điều chỉnh góc nhìn lên trên 
hoặc xuống dƣới vị trí của camera. Thiết bị bao gồm camera ảnh RGB, một bộ cảm 
biến chiều sâu hình ảnh và một bộ microphone ghi nhận âm thanh đa chiều, tất cả đƣợc 
vận hành bởi một phần mềm độc quyền. Bộ microphone của Kinect có khả năng xác 
định vị trí nguồn âm thanh và lọc nhiễu. Các thành phần này của Kinect cung cấp khả 
năng theo dõi chuyển động toàn cơ thể ngƣời dùng trong không gian 3 chiều, nhận 
diện khuôn mặt và nhận diện giọng nói. 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 5 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
Hình 4: Lƣới hồng ngoại phát ra từ Kinect 
Hình 5: Bản đồ chiều sâu của hình ảnh thu về thể hiện bằng màu gradient từ trắng(gần) 
đến xanh dƣơng(xa) 
Bộ cảm biến chiều sâu của Kinect bao gồm một máy chiếu hồng ngoại cùng một 
bộ phận cảm biến CMOS đơn sắc cho phép Kinect có thể ghi nhận hình ảnh 3 chiều 
dƣới bất kỳ điều kiện ánh sáng nào. Tầm hoạt động của bộ cảm biến chiều sâu này có 
thể điều chỉnh đƣợc, phần mềm của Kinect có thể tự xác định vùng cảm biến dựa trên 
gameplay và môi trƣờng vật lý xung quanh ngƣời chơi qua đó loại bỏ những nội thất 
trong phòng hoặc các vật cản trở tầm hoạt động. 
Kinect đƣợc Microsoft đăng kí độc quyền cùng với bộ phần mềm cho phép hệ 
thống có thể nhận biết cử chỉ, khuôn mặt, giọng nói một cách vƣợt bậc. Theo nhƣ các 
thông tin của các hãng bán lẻ, Kinect có thể ghi nhận 6 ngƣời cùng lúc kể cả hai ngƣời 
đang chơi để phân tích chuyển động của 20 khớp xƣơng mỗi ngƣời chơi. 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 6 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
Bộ cảm biến hình ảnh Kinect có dữ liệu video đầu ra với frame rate là 30Hz, độ 
phân giải 32-bit VGA (640×480px). Bộ cảm biến chiều sâu có độ phân giải 16-bit 
QVGA (320×240px với độ sâu 65,536 mỗi pixel) và có tầm hoạt động thực tế là từ 1.2 
đến 3.5 mét. Kinect có góc quan sát là 57° theo trục ngang và 43° theo trục dọc, trong 
khi đó trục cơ đứng có thể nghiêng lên xuống 27°. Bộ microphone bao gồm 4 
microphone riêng lẻ cho phép Kinect ghi nhận và xử lý âm thanh dƣới dạng 16-bit với 
tần số trung bình là 16 kHz. 
Hình 6: Microsoft Kinect sau khi đƣợc tháo rời hoàn toàn 
Kinect cần nhiều điện năng để hoạt động nên cổng USB của Xbox 360 không thể 
đáp ứng mà phải qua một adapter để chia thành 2 kết nối riêng là USB và kết nối 
nguồn, giúp cho thiết bị sẽ kết nối với Xbox 360 bằng cổng USB trong khi nguồn điện 
sẽ đƣợc lấy từ bo mạch của Xbox qua đƣờng AC adapter. Phiên bản Xbox 360 mới sẽ 
không cần adapter vì nó có các AUX port đặc biệt để cung cấp cho cổng kết nối. 
4. Cấu trúc của Kinect SDK: 
Microsoft cung cấp bộ thƣ viện lập trình để giúp các lập trình viên sử dụng các dữ 
liệu ngôn ngữ tự nhiên của cơ thể trong thời gian thực. 
Hình 7: Phần cứng và phần mềm của Kinect tƣơng tác với một ứng dụng 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 7 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
Các thành phần của SDK đƣợc thể hiện trong hình sau: 
Hình 8: Cấu trúc ứng dụng Kinect để phát triển ứng dụng trên Kinect SDK 
Các thành phần của SDK đƣợc thể hiện trong hình trên bao gồm: 
- Phần cứng: Các thành phần của phần cứng, bao gồm các bộ cảm biến Kinect và 
cổng USB mà thông qua đó cảm biến đƣợc kết nối với máy tính. 
- Trình điều khiển Kinect: Các trình điều khiển của Windows 7 cho bộ cảm biến 
Kinect đã đƣợc cài đặt theo SDK. Trình điều khiển này hỗ trợ: 
o Các cảm biến microphone của Kinect nhƣ các thiết bị âm thanh chuẩn, 
bạn có thể truy cập thông qua các API âm thanh tiêu chuẩn trong 
Windows. 
o Truyền dữ liệu hình ảnh bình thƣờng và hình ảnh dạng chiều sâu. 
o Cho phép một ứng dụng sử dụng nhiều hơn một cảm biến Kinect đƣợc 
kết nối với máy tính. 
o NUI API: Một tập hợp các API để lấy dữ liệu từ các cảm biến hình ảnh 
và điều khiển các thiết bị Kinect. 
o KinectAudio DMO: Khả năng xử lý âm thanh bao gồm loại bỏ tiếng ồn 
và tiếng vang, hình thành chùm tia để xác định nguồn âm thanh, và tích 
hợp với các hàm API nhận dạng giọng nói của Windows. 
o Các API chuẩn trong Windows 7: Các bộ thƣ viên về âm thanh, lời nói, 
và đa phƣơng tiện nhƣ mô tả trong Windows 7 SDK và Microsoft 
Speech SDK. 
Video Components Audio Components
Windows 
components
1
2
3
5
4
Kernel-mode drivers for Kinect for Windows 
DMO codec for mic array
Applications
Kinect for 
Windows SDK 
User-created 
components
USB Hub
Windows Core Audio 
and Speech APIs
Device 
setup
Audio stream controlVideo stream control
WinUSB device stack USBAudio audio stackWinUSB camera stack
Motor Audio mic arrayCameras
NUI API
A/V capture and transcoding
Media Foundation | DirectShow
User Mode
Kernel Mode
Kinect sensor
Hardware
Device 
access
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 8 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
CHƯƠNG 2: CÂU CHUYỆN BÍ MẬT VỀ SỰ PHÁT TRIỂN 
KINECT 
Vào giữa năm 2007, Don Mattrick – ngƣời phụ trách kinh doanh giải trí tƣơng tác 
của Microsoft ở Redmond – Washington đã đƣa ra yêu cầu về một hƣớng phát triển 
mới cho sản phẩm Xbox 360. Trong một buổi họp hoạch định chiến lƣợc, Marc 
Whitten, phó giám đốc điều hành Xbox live đã giải thích rằng họ sẽ phải thay đồi nền 
tảng tƣơng tác với Xbox. Sau đó, họ đƣa ra một danh sách vắn tắt các yêu cầu: điều 
khiển bằng chuyển động, nhận diện khuôn mặt, nhận dạng giọng nói và tƣơng thích 
với các sản phẩm Xbox đã có trên thị trƣờng. Ý tƣởng này đã ứng dụng nguyên tắc kết 
hợp trong tƣ duy sáng tạo nhằm mục đích kết hợp đồng thời cả 3 tính năng nhận dạng 
cho ra một sản phẩm duy nhất. 
Vấn đề đƣợc đƣa ra không chỉ có tính mơ mộng, trên thực tế việc hiện thực nó là 
hoàn toàn bất khả thi. Việc tìm một chiếc camera có thể nhìn một căn phòng thì rất đơn 
giản. Để có 1 sản phẩm cụ thể có khả năng giải mã đƣợc các chi của ngƣời dùng và 
giọng nói dành cho 40 triệu ngƣời dùng Xbox là cả một giấc mơ. Để hiện thực hóa sản 
phẩm này, thiết bị phần cứng đòi hỏi phải có một phần mềm có khả năng phân tích hơn 
1023 trƣờng hợp cần xử lý bao gồm cả cử chỉ và giọng nói trong cùng một lúc mà 
không gây ra bất kỳ hiện tƣợng trễ nào. 
Dù sao chăng nữa, các phần riêng lẻ của sản phẩm mới gần nhƣ đã có sẵn. Trung 
tâm nghiên cứu của Microsoft ở Bắc Kinh đã đạt đƣợc một số thành tựu nhất định 
trong việc nhận dạng khuôn mặt. Trung tâm nghiên cứu Redmond đã phát triển phần 
mềm nhận dạng giọng nói từ nhiều thập niên trƣớc. Và các kỹ sƣ phần cứng tại trung 
tâm Redmond đã rất bận rộn với việc tạo ra các bản mẫu cho các bộ điều khiển dựa 
trên gia tốc và chuyển động để chuẩn bị cho những sự đổi mới ở tƣơng lai. Họ đã ứng 
dụng nguyên tắc sao chép trong tƣ duy sáng tạo nhằm ứng dụng những công trình 
nghiên cứu đã có và tích hợp vào một sản phẩm mới. Tuy nhiên, nó vẫn luôn đòi hỏi 
một sự nghiên cứu thấu đáo và chạy thử trƣớc khi bất kỳ ai có thể khẳng định rằng nó 
có chạy đƣợc hay không hoặc là có tạo ra lợi nhuận hay không. Vấn đề lớn nhất gặp 
phải ở đây là: việc này chƣa đƣợc thực hiện ở bất kỳ nơi nào trên cả thế giới. 
Alex Kipman, 31 tuổi là ngƣời đƣợc giao nhiệm vụ hiện thực hóa yêu cầu của 
Mattrick. Kipman đến từ Natal tại Brazil với 16 bằng sáng chế tại Microsoft tính từ khi 
ông bắt đầu làm việc vào năm 2001. Kipman cho rằng việc đầu tiên phải làm là nghiên 
cứu khả năng máy học: khả năng huấn luyện máy tính dự đoán. 
Nhóm của Kipman bao gồm 15 ngƣời bắt đầu trải qua quá trình huấn luyện với các 
kỹ năng hoàn toàn mới nhằm làm phong phú phƣơng pháp suy nghĩ và sáng tạo. Khóa 
huấn luyện này đƣợc huấn luyện bởi các họa sĩ, nhạc sĩ, nhà thiết kế, nghiên cứu viên, 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 9 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
kỹ sƣ, một số ngƣời đến từ Hollywood, giám đốc hiệu ứng của bộ phim “Ma trận”… 
Họ tóm tắt lại rằng nhiệm vụ của họ là tự đặt mình là những kẻ dễ thất bại và ngu dốt, 
nó chính là động lực khiến họ làm việc cật lực nhằm đạt đƣợc những kết quả mới. 
Ở một số khía cạnh, họ ít gặp phải thách thức mới hơn các khía cạnh còn lại. Ví dụ 
nhƣ việc nhận dạng giọng nói đã là kết quả của một quá trình nghiên cứu lâu dài của 
Microsoft. Tuy nhiên ở khía cạnh nhận diện từng ngƣời một cách chính xác dựa trên 
khuôn mặt và hình dáng cơ thể thì rất khó. Kipman nói rằng: “Darwin đã chống lại 
chúng tôi, mọi ngƣời ở trong một gia đình thƣờng rất giống nhau về ngoại hình. Và 
chúng tôi gọi việc nhận dạng ở đây chính xác là nhận dạng đặc tính chứ không phải là 
nhận dạng khuôn mặt. Việc sử dụng nhận dạng khuôn mặt ở đây hoàn toàn không đem 
lại hiệu quả.” 
Việc ghi nhận chuyển động của cơ thể ngƣời để nhận dạng cử chỉ và lời nói của 
con ngƣời khiến máy tính phải đối mặt với khoảng 1023 trƣờng hợp có thể xảy ra. 
Kipman biết rằng việc này vƣợt xa hơn khả năng lập trình một cách bình thƣờng rất 
nhiều. Kipman biết rằng ông phải đƣa ra một khái niệm lập trình mới tại Microsoft và 
ông ta đã làm đƣợc – khiến cho ngôn ngữ lập trình có thể mô tả và xử lý những trƣờng 
hợp chƣa gặp bao giờ. 
Tamir Berliner, 29 tuổi cùng 4 ngƣời khác đang làm việc tại cùng một đơn vị trực 
thuộc bộ quốc phòng Israel là những nhà đồng sáng lập PrimeSense. Thành lập vào 
tháng 05/2005, Tel Aviv – tiền thân của PrimeSense có 130 nhân viên và mở ra hơn 5 
chi nhánh trên toàn Châu Á. Họ tìm cách giải quyết vấn đề sử dụng một bộ cảm biến 
chiều sâu để để nhận dạng một ngƣời đang chuyển động. Họ đã ứng dụng nguyên tắc 
sao chép và nguyên tắc tự phục vụ trong tƣ duy sáng tạo bằng cách sử dụng một bộ 
phát hồng ngoại và một bộ thu hình ảnh hồng ngoại để thu lại lƣới hồng ngoại thiết bị 
đã phát ra và dựa trên đó xây dựng chiều sâu của từng điểm ảnh. Berliner cho biết bản 
thân họ cũng là những game thủ và học nhận thấy việc chơi game trên máy tính rất 
nhàm chán, họ muốn họ có thể thực hiện các thao tác của nhân vật trong game để điều 
khiển chính nhân vật của mình. 
Giới thiệu sản phẩm lần đầu tiên vào tháng 03/2006, hai tháng sau, PrimeSense 
đƣa bản nâng cấp của sản phẩm đến hội chợ E3 ở Los Angeles – một hộp nhựa màu 
trắng, dài 30cm, rộng 10cm, bao gồm 1 camera RGB, một cảm biến hồng ngoại và một 
nguồn sáng. Khi lần đầu tiên Kipman đƣợc nhìn thấy sản phẩm này, ông ta đã nhanh 
chóng nhận ra đƣợc những gì có thể làm với thiết bị này. 
Team Xbox đã bí mật ký hợp đồng với PrimeSense – cung cấp chip cảm biến 
chiều sâu và các thiết kế liên quan. Tại đây, nguyên tắc phân nhỏ và nguyên tắc lấy 
“rẻ” thay cho “đắt” trong tƣ duy sáng tạo đã đƣợc áp dụng nhằm mục đích thu nhỏ bộ 
camera cảm biến và hạ giá thành sản phẩm. Raghu Murthi – giám đốc bộ phận sản 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 10 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
xuất phần cứng cho Xbox - cho hay: “Các thiết bị phần cứng phải đƣợc thu nhỏ tối đa 
và gần nhƣ không tồn tại trong con mắt ngƣời dùng. Qua đó, ngƣời dùng có thể tƣơng 
tác với hệ thống nhƣng không thể biết rằng Microsoft đã làm điều đó bằng cách nào.” 
Vào đầu năm 2008, Kudo Tsunoda, 36 tuổi, tham gia vào bộ phận phát triển game 
của Microsoft từ Electronic Arts để phát triển Gears of War 2. Trong một buổi họp 
giới thiệu Tsunoda với các đồng nghiệp tại Redmond, Kipman đến và mang theo thiết 
bị đƣợc tạo ra dựa trên bộ camera cảm biến của PrimeSense. Kipman mô tả về sản 
phẩm này một cách rất đơn giản – nó thể hiện góc nhìn 3 chiều, không âm thanh, 
không RGB – nhƣng ngay lập tức Tsunoda đã hoàn toàn bị chinh phục. Anh ta nhắc đi 
nhắc lại rằng: “Đây quả thực là một điều tuyệt vời, chúng ta có thể làm hàng trăm thứ 
với thiết bị này.” Cuộc họp của họ đã kéo dài hơn 4 tiếng đồng hồ. 
Sau đó, sự phấn khích của Tsunoda đã giảm bớt ngay sau một phép thử thực tế. 
Tsunoda gọi lại cho Kipman và cho rằng họ không thể làm đƣợc bởi vì họ có thể theo 
dõi chuyển động nhƣng các chuyển động này không có gia tốc nhất định và có rất 
nhiều dạng chuyển động khác nhau. Tuy nhiên họ cũng thống nhất rằng họ có thể tích 
hợp microphone để nhận dạng giọng nói và một camera RGB để giúp ngƣời chơi có 
thể nhìn thấy chính mình một cách rõ ràng trên màn hình. Nguyên tắc kết hợp trong tƣ 
duy sáng tạo đã đƣợc áp dụng nhằm tạo ra một thiết bị với nhiều tính năng hơn. 
Cũng giống nhƣ Kipman, Tsunoda cũng có một nhóm nghiên cứu đã có kinh 
nghiệm tạo bản mẫu cho khoảng 70 game. Khi team của Kipman tạo ra bản mẫu cho 
một khung xƣơng di chuyển dựa trên cấu trúc cơ thể ngƣời, họ kết hợp cùng làm việc 
với team của Tsunoda. Nhận dạng con ngƣời lúc nào cũng là một rào cản lớn đối với 
họ và việc nhận dạng âm thanh cũng gặp khó khăn trong quá trình khử nhiễu. 
Nhóm của Kipman và Tsunoda làm việc chung với nhau và đối mặt với deadline 
vào ngày 18/08/2008, một cuộc họp với các nhân viên của Microsoft và quyết định 
tính sống còn của dự án. Họ mang đến một bộ cảm biến và nói với mọi ngƣời rằng: 
“Chúng tôi sẽ không nói bất cứ điều gì về mặt công nghệ. Chúng tôi không nói chúng 
tôi đã làm những gì. Tất cả những gì bạn cần làm là trải nghiệm nó, hãy ngồi xuống và 
chơi. Nó là một chiếc ô tô, hãy lái nó theo cách bạn thƣờng lái.” Marc Whitten đã mỉm 
cƣời, cuộc họp trở nên sáng sủa khi những công nghệ sử dụng đƣợc Kipman giải thích. 
Mọi ngƣời đều nhận thấy sức mạnh của công nghệ mới này. Kipman đã có thêm thời 
gian nhƣng nhiều câu hỏi lớn vẫn chƣa đƣợc giải đáp. 
Giáo sƣ Blake, 54 tuổi, làm việc tại trung tâm nghiên cứu của Microsoft tại 
Cambridge từ năm 1999 đã có 32 bằng sáng chế cho Microsoft. Ông là một trong 
những chuyên gia đi đầu của thế giới trong lĩnh vực thị giác máy (Computer Vision). 
Ông nổi tiếng với các nghiên cứu nhƣ theo dõi nhịp đập tim thông qua hình ảnh, công 
cụ tẩy nền của hình ảnh trong Office 2010, hệ thống tìm kiếm bằng lazer cho phép máy 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 11 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
bay trực thăng quân đội theo dõi mặt đất… Vào năm 2001, Blake xuất bản một bài báo 
khoa học cùng với một nhà nghiên cứu khác của Microsoft tên là Kentaro Toyama. Bài 
báo đƣa ra một hƣớng tiếp cận mới để theo dõi sự chuyển động của các vật thể. 
Tên của bài báo là “Probabilistic Tracking in a Metric Space”, bài báo đã giả dụ 
rằng chuyển động của một vũ công ba lê có thể đƣợc theo dõi bằng cách đƣa ra một 
xác suất có thể để một khung hình có thể đi đến một khung hình kế tiếp (có thể hiểu là 
dự đoán trƣớc chuyển động dựa trên xác suất thống kê). Nguyên tắc giải “thiếu” đã 
đƣợc Blake áp dụng để đƣa ra một kết quả mang tính gần đúng cho bài toán. Bằng 
cách nhập vào các dữ liệu thô mô tả di chuyển của vũ công tại mỗi khung hình, hệ 
thống máy tính có thể đƣa ra đƣợc khung hình kế tiếp gần đúng nhất so với chuyển 
động của vũ công. 
Hƣớng tiếp cận này đƣợc Blake mô tả “nhƣ là một cuốn tranh lật hoạt hình với các 
tƣ thế nguyên mẫu” đã tạo ra một làn sóng mới trong lĩnh vực nghiên cứu máy học và 
đoạt giải thƣởng Marr. Nó cũng gây ảnh hƣởng đến một post-doc đang làm việc tại 
Oxford tên là Andrew Fitzgibbon, một chuyên gia trong lĩnh vực thị giác máy. Vào 
năm 2007, Fitzgibbon, 42 tuổi đã xuất bản một bài báo “The Joint Manifold Model for 
Semi-supervised Multi-valued Regression” mô tả cách sử dụng xác suất để dự đoán 
chuyển động của cơ thể. Tuy nhiên hƣớng tiếp cận này gặp phải một rào cản khá lớn 
đó là: nó chỉ hoạt động đƣợc với khoảng 50 chuyển động của cơ thể, thời gian xử lý rất 
chậm – mất khoảng 1 phút để đƣa ra khung hình tiếp theo của chuyển động. 
Tại điểm này, nhóm của Kipman tìm thấy một bài báo từ Toshiba – nơi mà các nhà 
nghiên cứu đang cố gắng theo dõi chuyển động theo thời gian thực với một camera 
bình thƣờng chứ không phải một camera 3 chiều. Blake nói rằng họ đã dựa trên nghiên 
cứu của ông và Toyama và mở rộng phạm vi của nó lên. Cuốn tranh lật hoạt hình của 
Blake chỉ có khoảng 100 trang nay đã lên tới 50,000 trang dƣới nghiên cứu của 
Toshiba và có thể theo dõi tất cả các trạng thái của cơ thể. 
Tuy nhiên các nghiên cứu của Toshiba đã đƣợc Blake cho rằng chƣa thể ứng dụng 
đƣợc bởi vì hoán vị các chuyển động của cơ thể là quá lớn dẫn đến việc áp dụng xác 
suất không đem lại hiệu quả. “Nếu mỗi điểm của cơ thể đƣợc chia làm 10 bộ góc, có 
tới 1030 khả năng cho chuyển động kế tiếp. Nó sẽ không chính xác.”, Blake nói. 
Câu trả lời cho bài toán đến từ nghiên cứu tiến sĩ của Jamie Shotton, một nhà 
nghiên cứu mới ra trƣờng làm việc tại bộ phận của Blake. Shotton đã khiến cho máy 
tính có khả năng phân biệt bò, cỏ hoặc máy bay trong một tấm hình đồng quê bằng 
cách cho máy tính học theo từng pixel một. Anh ta đã huấn luyện cho máy tính có khả 
năng nhận diện 21 danh mục vật thể khác nhau. 
Một cách tình cờ, Kipman đã đọc đƣợc bài báo của Shotton viết về việc theo dõi 
cử động của bàn tay. Kipman nhận xét rằng bài viết đƣợc viết khá chi tiết và mang tính 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 12 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
lạc quan. Vào ngày 18/08/2008, Kipman đã gọi cho Shotton và trình bày ý tƣởng của 
mình. Shotton đã bàn luận với Fitzgibbon và nhận đƣợc câu trả lời rằng ý tƣởng đó 
không thể hiện thực đƣợc. Nhóm của Kipman đã chủ động mang thiết bị bay tới 
Cambridge và cho Shotton xem khả năng của bộ camera cảm biến 3 chiều. Màn hình 
cho thấy một bộ khung ngƣời đang đựa vẽ lên trên một bộ nền, bộ nền hiển thị những 
gì bộ cảm biến chiều sâu nhìn thấy. Một khi hệ thống nhân dạng đƣợc hình dáng cơ thể 
ngƣời, nó sẽ vẽ lên bộ khung tƣơng ứng. 
Vấn đề gặp phải với bộ xƣơng ở đây là cơ thể ngƣời luôn chuyển động một cách 
không thể dự đoán trƣớc và các chuyển động này không hoàn toàn giống nhau. Vì vậy 
hệ thống thƣờng xuyên bị lỗi khi tay, chân hoặc đầu chuyển động. Nếu họ quay lại sử 
dụng phƣơng pháp của Blake, dữ liệu huấn luyện sẽ rất lớn và dữ liệu này sẽ không 
phù hợp với bộ nhớ của Kinect. Họ bắt đầu suy nghĩ đến phƣơng pháp chia cơ thể ra 
làm nhiều phần khác nhau. Tại đây, nguyên tắc phân nhỏ trong tƣ duy sáng tạo đã 
đƣợc áp dụng. Cuối cùng Shotton quyết định quay lại nghiên cứu giải pháp cũ trong 
việc cho máy tính học theo từng pixel. Đây chính là khoảnh khắc đột phá: nếu hệ 
thống đƣợc huấn luyện để nhận dạng từng phần riêng biệt của cơ thể - với sự trợ giúp 
của bộ cảm biến chiều sâu – hệ thống sẽ nhận dạng đƣợc chuyển động trong bất kỳ 
trạng thái nào. 
Fitzgibbon chạy một đoạn video mô tả các bộ phận của cơ thể ngƣời cánh tay trái 
xuống đến bàn chân phải đã đƣợc tô màu, mỗi một bộ màu chuyển động cùng với cơ 
thể khi nó di chuyển. 31 phần của cơ thể khác nhau có 31 màu khác nhau. Nguyên tắc 
thay đổi màu sắc trong tƣ duy sáng tạo đã đƣợc áp dụng để đánh dấu các bộ phận khác 
nhau cảu cơ thể sau khi phân nhỏ. Shotton cho rằng nếu có thể huấn luyện hệ thống 
với hàng triệu trạng thái chuyển động khác nhau của cơ thể, bạn có thể điều chỉnh 
thuật toán sao cho nó có thể bỏ qua các giai đoạn bạn thay đổi từ trạng thái chuyển 
động này sang trạng thái chuyển động khác, hoặc là hình dạng của bạn (mập lên hay 
ốm đi) và lƣu giữ thông tin quan trọng nhất đó là điểm ảnh đó thuộc về bộ phận nào 
của cơ thể. Những chuyển động của ngón tay cũng có thể đƣợc giải quyết vì giới hạn 
độ phân giải của camera ngày nay đã đƣợc mở rộng. 
Họ đặt tên cho hệ thống mới này là hệ thống “Exemplar” và bắt đầu huấn luyện 
thuật toán với 100 tấm ảnh con ngƣời do máy tính sinh ra. Vào tháng 06/2009, hệ 
thống đã sẵn sàng để đƣợc công bố tại triển lãm E3 ở Los Angeles. Sáu tháng sau, 
nhóm đã bàn giao lại kết quả nghiên cứu cho nhóm nghiên cứu ở Redmond. Shotton đã 
không đƣợc chơi thử bất kỳ game nào cho đến tháng 08/2010 và anh ta đã rất ngạc 
nhiên với những gì mà nhóm nghiên cứu ở Redmond đã làm đƣợc. Riêng Blake, niềm 
vui thú lớn nhất của ông là dự án này đã mở ra tƣơng lai của việc tƣơng tác ngƣời – 
máy. 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 13 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
Dự án máy học này tiếp tục phát triển và đƣợc phát triển phần mềm bởi nhóm của 
Ben Kilgore. “Chúng tôi chia mọi thứ làm 3-4 vấn đề chính để giải quyết, mỗi vấn đề 
chính bao gồm khoảng 20 vấn đề nhỏ”, Kilgore nói. Trong vấn đề nhận dạng giọng 
nói, công việc rất nhiều, họ phải xây dựng các mô hình âm học riêng cho ngôn ngữ của 
từng nƣớc mà sản phẩm của họ có hỗ trợ. Một lần nữa, nguyên tắc phân nhỏ trong tƣ 
duy sáng tạo lại tiếp tục đƣợc ứng dụng trong việc giải quyết vấn đề. 
Tại thời điểm này, việc kiểm thử một cách khắt khe là vấn đề sống còn của phần 
cứng, phần mềm và game cho thiết bị đã bắt đầu đƣợc phát triển. Việc kiểm thử phần 
cứng bao gồm cho phép ngƣời chơi sử dụng trong các điều kiện nhiệt độ, độ ẩm và ánh 
sáng khác nhau. Nguyên tắc gây ứng suất sơ bộ đã đƣợc áp dụng trong quá trình kiểm 
thử phần cứng nhằm tránh những sai sót không mong muốn khi đặt thiết bị trong 
những môi trƣờng khác nhau. Raghu Murthi cho biết việc kiểm thử đƣợc thực hiện 
trong các lò hấp lớn để có thể đƣa ra các điều kiện nhiệt độ cao thấp khác nhau, việc 
kiểm thử hệ thống microphone và hệ thống âm thanh đƣợc thực hiện trong các tòa nhà 
không có tiếng vang và không có âm thanh ảnh hƣởng từ bên ngoài. 
Nhóm của Kipman và Tsunoda đã gặp Andreas – giám đốc sáng tạo của Rare, 39 
tuổi với 15 năm kinh nghiệm làm việc tại Rare và đã trình bày với anh ta những gì họ 
đã làm đƣợc cho đến lúc này. Và khi Burton - giám đốc điều hành của Rare theo dõi 
màn hình với bộ xƣơng của chính mình đang di chuyển theo từng cử động của anh ta, 
Burton đã rất khiếp sợ. Anh ta nói: “Đó là khoảnh khắc Natal của chúng tôi, tôi đƣợc 
điều khiển bộ xƣơng của chính mình, thật là một điều kì diệu. Tôi đã ngồi tại văn 
phòng của Kudo cho đến khi anh ta đƣa cho chúng tôi bộ công cụ phát triển phần mềm 
cho thiết bị đó, tôi mới chịu rời khỏi.” 
Họ trở về và bắt đầu tạo bản mẫu cho các trò chơi. Andreas đã từng là một cầu thủ 
bóng đá bán chuyên nghiệp tại đội Crystal Palace và nhận thấy họ có thể phát triển trò 
chơi đá bóng trong 3 chiều. Anh ta cho rằng việc dắt bóng rất phức tạp và nếu họ làm 
đƣợc thì sẽ chứng minh đƣợc sức mạnh công nghệ của họ. Vậy là họ bắt đầu xây dựng 
bản mẫu cho trò chơi đá bóng và đã thành công. 
Vào Noel năm 2008, họ tập trung vào việc thực hiện 3 ý tƣởng chính và một trong 
số đó là thể thao. Andreas cho biết họ muốn cạnh tranh trực tiếp với Wii Sports. Do 
mục tiêu của họ là thị trƣờng khách hàng gia đình nên họ chọn các môn thể thao thông 
dụng nhất. Họ tạo bản mẫu cho khoảng 20 môn thể thao từ đua ngựa đến đua xe đạp 
trong đó tập trung nhất vẫn là trò chơi đá bóng. 
Các lập trình viên gặp phải những khó khăn nhất định khi chuyển môi trƣờng làm 
việc từ PC sang Xbox. Riêng đối với trò chơi đá bóng, việc theo dõi chuyển động chân 
thiếu độ chính xác và độ trễ bị tăng lên bởi vì những điển đó nằm ở vị trí thấp nhất của 
cơ thể. Vấn đề này mất 3 tháng để giải quyết. Andreas vui mừng: “Chƣa tới 2 năm, 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 14 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
chúng tôi đã có công nghệ mới, phần mềm mới, thiết bị mới và một định nghĩa khác 
khi nói đến trò chơi.” 
Một khu vực rông khoảng 36 hecta trong công viên Warwichshire đƣợc sử dụng 
để kiểm tra khả năng của Kinect. Trong ngày cuối cùng sửa lỗi trò chơi Kinect Sports, 
và trong một chuỗi các tòa nhà xung quanh văn phòng trung tâm, rất nhiều ngƣời trong 
số 200 nhân viên của công ty đang đổ mồ hôi một cách đúng nghĩa để bảo đảm rằng 10 
môn thể thao tích hợp trong game này từ bowling đến boxing đã sẵn sàng để ra mắt 
vào ngày 04/11 tại Mỹ và 6 ngày sau tại Châu Âu. 
Tại phòng kiểm thử ở tầng dƣới, hai ngƣời phụ nữ trong trang phục thể thao đang 
chơi bóng bàn bằng cách quơ tay một cách điên cuồng trong không khí và một ngƣời 
phụ nữ khác đấm bốc một cách hăng hái vào không khí. Trên tầng trên, nơi mà các nhà 
phát triển ngồi cùng với các nhà thiết kế, lập trình viên và các nhà quản lý, khung cảnh 
hiện ra rất kỳ quái: một ngƣời đang chạy tại chỗ ngay cửa phòng của anh ta, một ngƣời 
la to “Goal kick!” và ngƣời thứ 3 hiện ra với các cử chỉ biểu hiện rằng anh ta đang cố 
gắng ném đi một cây lao trong tƣởng tƣợng. Burton cho biết đây là nơi mà chiếc 
Kinect đầu tiên bị hƣ. Đồng nghiệp của anh ta, Andreas cho biết: “Tòa nhà này là nơi 
mà bạn có thể tìm thấy nhiều Kinect nhất tại đất nƣớc này.” 
“Vào ngày 04/11, đó sẽ không phải là ngày mà Kinect dừng lại sự phát triển của 
nó, tất cả chỉ mới là sự bắt đầu.” 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 15 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
CHƯƠNG 3: KẾT LUẬN 
Kinect tuy là một sản phẩm hoàn toàn mang tính thƣơng mại nhƣng có thể xem 
nhƣ một biểu tƣợng cho sự sáng tạo và khả năng khám phá của con ngƣời trong thế kỷ 
21. Nó đã mở ra một kỷ nguyên mới trong việc tƣơng tác ngƣời-máy và mở ra các 
hƣớng phát triển mới trong các lĩnh vực y tế, giáo dục, quốc phòng… 
Qua câu chuyện về sự hình thành và phát triển của Kinect, chúng ta nhận thấy mọi 
điều kỳ diệu đều xuất phát từ ý tƣởng. Một ý tƣởng tốt nếu đƣợc đầu tƣ một cách đúng 
đắn sẽ từng bƣớc đi đến thành công. Bên cạnh đó, việc nghiên cứu cần có sự hỗ trợ đắc 
lực của các cá nhân, tổ chức có cùng định hƣớng nghiên cứu nhằm đạt đƣợc một mục 
đích chung. 
Với Kinect, cá nhân tiêu biểu cho sự thành công của dự án này là Kipman, ông đã 
không ngừng tìm tòi, nghiên cứu và ứng dụng các giải pháp để có lời giải cuối cùng 
cho bài toán của mình. Câu chuyện cũng cho thấy việc bồi dƣỡng các kỹ năng tƣ duy 
sáng tạo là một bƣớc tiến nhằm thay đổi các lối mòn trong suy nghĩ và đƣa chúng ta 
đến gần với những giải pháp mới để giải quyết vấn đề một cách chính xác và hoàn 
thiện hơn. 
Chúng ta cũng thấy rõ sự thành công của dự án này cũng có một phần đóng góp 
không nhỏ về tiềm lực tài chính cũng nhƣ tiềm lực về công nghệ đã nghiên cứu trƣớc 
của Microsoft. Dựa trên đó, chúng ta phải hiểu rằng việc nghiên cứu trƣớc hết phải dựa 
trên cơ sở vững chắc về kiến thức cơ bản và khả năng nắm bắt công nghệ mới, tiềm lực 
tài chính cũng là một động lực thúc đẩy sự thành công của công tác nghiên cứu và sáng 
tạo. 
----- o0o ----- 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 16 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
PHỤ LỤC 
(Các nguyên tắc tƣ duy sáng tạo đã đƣợc phân tích trong bài viết) 
1) Nguyên tắc phân nhỏ: 
 Chia đối tƣợng thành các phần độc lập. 
 Làm đối tƣợng trở nên tháo lắp đƣợc. 
 Tăng mức độ phân nhỏ đối tƣợng. 
2) Nguyên tắc kết hợp: 
 Kết hợp các đối tƣợng đồng nhất hoặc các đối tƣợng dùng cho các hoạt động kế 
cận. 
 Kết hợp về mặt thời gian các hoạt động đồng nhất hoặc kế cận. 
3) Nguyên tắc gây ứng suất sơ bộ: 
 Gây ứng suất trƣớc với đối tƣợng để chống lại ứng suất không cho phép hoặc 
không mong muốn khi đối tƣợng làm việc ( hoặc gây ứng suất trƣớc để khi làm 
việc sẽ dùng ứng suất ngƣợc lại ). 
4) Nguyên tắc giải “thiếu” hoặc “thừa”: 
 Nếu nhƣ khó nhận đƣợc 100 hiệu quả cần thiết, nên nhận ít hơn hoặc nhiều 
hơn “một chút”. Lúc đó bài toán có thể trở nên đơn giản hơn và dễ giải hơn. 
5) Nguyên tắc tự phục vụ 
 Đối tƣợng phải tự phục vụ bằng cách thực hiện các thao tác phụ trợ, sửa chữa. 
 Sử dụng phế liệu, chát thải, năng lƣợng dƣ. 
6) Nguyên tắc sao chép ( copy) 
 Thay vì sử dụng những cái không đƣợc phép, phức tạp, đắt tiền, không tiện lợi 
hoặc dễ vỡ, sử dụng bản sao. 
 Thay thế đối tƣợng hoặc hệ các đối tƣợng bằng bản sao quang học (ảnh, hình 
vẽ) với các tỷ lệ cần thiết. 
 Nếu không thể sử dụng bản sao quang học ở vùng biểu kiến ( vùng ánh sáng 
nhìn thấy đƣợc bằng mắt thƣờng ), chuyển sang sử dụng các bản sao hồng ngoại 
hoặc tử ngoại. 
7) Nguyên tắc “rẻ” thay cho “đắt”: 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 17 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
 Thay thế đối tƣợng đắt tiền bằng bộ các đối tƣợng rẻ có chất lƣợng kém hơn (thí 
dụ nhƣ về tuổi thọ). 
8) Nguyên tắc thay đổi màu sắc: 
 Thay đổi màu sắc của đối tƣợng hay môi trƣờng bên ngoài. 
 Thay đổi độ trong suốt của của đối tƣợng hay môi trƣờng bên ngoài. 
 Để có thể quan sát đƣợc những đối tƣợng hoặc những quá trình, sử dụng các 
chất phụ gia màu, hùynh quang. 
 Nếu các chất phụ gia đó đã đƣợc sử dụng, dùng các nguyên tử đánh dấu. 
 Sử dụng các hình vẽ, ký hiệu thích hợp. 
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 18 
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh 
TÀI LIỆU THAM KHẢO 
Tiếng Việt: 
[1]. Giáo trình sơ cấp tóm tắt: Phương pháp luận sáng tạo khoa học – kỹ thuật giải 
quyết vấn đề và ra quyết định, Phan Dũng (1994), Trung tâm sáng tạo KHKT – 
Tp.HCM. 
[2]. Phương pháp luận nghiên cứu khoa học, Vũ Cao Đàm (2001), Nhà xuất bản Đại 
học Hà Nội. 
[3].Slide Phương pháp luận sáng tạo khoa học, Hoàng Văn Kiếm (2011), Đại học 
Công nghệ Thông tin - ĐHQG Tp.HCM. 
Tiếng Anh: 
[4].Website:  
[5].Website:  
            Các file đính kèm theo tài liệu này:
tieuluanpplstkh_ch1101159_4554.pdf