Kinect tuy là một sản phẩm hoàn toàn mang tính thƣơng mại nhƣng có thể xem
nhƣ một biểu tƣợng cho sự sáng tạo và khả năng khám phá của con ngƣời trong thế kỷ
21. Nó đã mở ra một kỷ nguyên mới trong việc tƣơng tác ngƣời-máy và mở ra các
hƣớng phát triển mới trong các lĩnh vực y tế, giáo dục, quốc phòng
Qua câu chuyện về sự hình thành và phát triển của Kinect, chúng ta nhận thấy mọi
điều kỳ diệu đều xuất phát từ ý tƣởng. Một ý tƣởng tốt nếu đƣợc đầu tƣ một cách đúng
đắn sẽ từng bƣớc đi đến thành công. Bên cạnh đó, việc nghiên cứu cần có sự hỗ trợ đắc
lực của các cá nhân, tổ chức có cùng định hƣớng nghiên cứu nhằm đạt đƣợc một mục
đích chung.
Với Kinect, cá nhân tiêu biểu cho sự thành công của dự án này là Kipman, ông đã
không ngừng tìm tòi, nghiên cứu và ứng dụng các giải pháp để có lời giải cuối cùng
cho bài toán của mình. Câu chuyện cũng cho thấy việc bồi dƣỡng các kỹ năng tƣ duy
sáng tạo là một bƣớc tiến nhằm thay đổi các lối mòn trong suy nghĩ và đƣa chúng ta
đến gần với những giải pháp mới để giải quyết vấn đề một cách chính xác và hoàn
thiện hơn.
22 trang |
Chia sẻ: lylyngoc | Lượt xem: 2320 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tiếu luận phương pháp luận sáng tạo khoa học: quá trình hình thành và phát triển của microsoft kinect, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC MÁY TÍNH
TIẾU LUẬN PHƯƠNG PHÁP LUẬN
SÁNG TẠO KHOA HỌC:
QUÁ TRÌNH HÌNH THÀNH
VÀ PHÁT TRIỂN
CỦA MICROSOFT KINECT
Giảng viên hướng dẫn: GS. TS. HOÀNG VĂN KIẾM
Học viên thực hiện: NGUYỄN PHƯƠNG ANH
Lớp: Cao học Khóa 6 MSHV: CH1101159
TP. Hồ Chí Minh, tháng 04 năm 2012
LỜI CẢM ƠN
Em xin bày tỏ lòng biết ơn sâu sắc đến GS. TS. Hoàng Văn Kiếm, trưởng bộ
môn Kỹ thuật phần mềm khoa Công Nghệ Phần Mềm, trường Đại học Công Nghệ
Thông Tin, ĐHQG TP.HCM đã tận tình hướng dẫn, cung cấp kiến thức, truyền đạt
những kinh nghiệm quí báu giúp em hoàn thành tốt bài tiểu luận này.
Xin cám ơn cha, mẹ, các anh, chị em trong gia đình đã hỗ trợ, lo lắng và động
viên. Đồng thời, xin cám ơn tất cả các bạn đã ủng hộ, giúp đỡ chúng tôi trong quá
trình thực hiện bài tiểu luận này.
Dù đã có nhiều cố gắng nhưng chắc chắn sẽ không tránh khỏi những thiếu sót,
em rất mong nhận được sự đóng góp ý kiến của các Thầy giáo, Cô giáo và các bạn để
đề tài này được hoàn thiện hơn.
Em xin chân thành cảm ơn!
Tp Hồ Chí Minh, tháng 04 năm 2012
Học viên
NHẬN XÉT
(Của giảng viên hƣớng dẫn)
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
...............................................................................................................................................................
MỤC LỤC
LỜI NÓI ĐẦU ................................................................................................................. 1
CHƢƠNG 1: TÌM HIỂU MICROSOFT KINECT ......................................................... 2
1. Giới thiệu về Microsoft Kinect ............................................................................. 2
2. Lịch sử phát triển ................................................................................................... 2
3. Cấu trúc phần cứng của Kinect ............................................................................. 4
4. Cấu trúc của Kinect SDK ...................................................................................... 6
CHƢƠNG 2: CÂU CHUYỆN BÍ MẬT VỀ SỰ PHÁT TRIỂN KINECT ..................... 8
CHƢƠNG 3: KẾT LUẬN ............................................................................................. 15
PHỤ LỤC ...................................................................................................................... 16
TÀI LIỆU THAM KHẢO ............................................................................................. 18
MỤC LỤC HÌNH ẢNH
Hình 1: Thiết bị Microsoft Kinect ................................................................................... 2
Hình 2: Gian hàng của Microsoft tại triển lãm E3 - 2009 ............................................... 3
Hình 3: Cấu trúc phần cứng bên trong Kinect................................................................. 4
Hình 4: Lƣới hồng ngoại phát ra từ Kinect ..................................................................... 5
Hình 5: Bản đồ chiều sâu của hình ảnh thu về thể hiện bằng màu gradient từ trắng(gần)
đến xanh dƣơng(xa) ......................................................................................................... 5
Hình 6: Microsoft Kinect sau khi đƣợc tháo rời hoàn toàn ............................................. 6
Hình 7: Phần cứng và phần mềm của Kinect tƣơng tác với một ứng dụng .................... 6
Hình 8: Cấu trúc ứng dụng Kinect để phát triển ứng dụng trên Kinect SDK ................. 7
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 1
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
LỜI NÓI ĐẦU
Kể từ khi máy tính cá nhân đƣợc phát triển, máy tính đƣợc sản xuất hƣớng tới
ngƣời dùng phổ thông nhiều hơn. Điều đó thúc đẩy tƣơng tác ngƣời-máy cũng đƣợc
phát triển theo những hình thức ngày càng đơn giản hơn và tự nhiên hơn. Trong lịch sử
máy tính hiện đại đã có 2 cuộc cách mạng lớn về thiết bị đã dẫn tới những thay đổi của
tƣơng tác ngƣời-máy, và sắp tới có thể là cuộc cách mạng của thiết bị Kinect và các
thiết bị tƣơng tự.
Nỗ lực sớm nhất của việc thay đổi tƣơng tác ngƣời-máy là vào năm 1880, khi
Herman Hollerith làm việc ở Cục điều tra dân số Hoa Kì, tìm cách xử lý dữ liệu dân số
bằng máy. Kết quả là máy tính sử dụng bìa đục lỗ đã đƣợc tạo ra, đem tới một phƣơng
thức thao tác đơn giản hơn với dữ liệu. Sau này, bàn phím tồn tại cùng với sự phát
triển của các máy tính hiện đại. Nhƣng 2 điều vừa nêu vẫn chƣa phải là những cuộc
cách mạng vì bìa đục lỗ quá phức tạp và thao tác với các phím mũi tên trên bàn phím
vẫn chƣa quen thuộc với thói quen tự nhiên của con ngƣời.
Cho tới năm 1983, chuột máy tính đầu tiên đƣợc giới thiệu cùng với máy Lisa của
Apple. Đi kèm đó là sự xuất hiện của giao diện ngƣời dùng đồ hoạ (Graphical User
Interface - GUI). Và đây là cuộc cách mạng đầu tiên trong tƣơng tác ngƣời-máy. Chuột
máy tính sau đó đã trở nên không thể thiếu với hầu hết máy tính cá nhân.
Cuộc cách mạng tiếp theo là sự phổ biến nhanh chóng và mạnh mẽ của công nghệ
cảm ứng đa điểm, dẫn đầu bởi thiết bị di động mang tính cách mạng iPhone của Apple.
Cảm ứng đa điểm cho phép tƣơng tác ngƣời-máy thông qua chạm và vuốt trên màn
hình cảm ứng. Công nghệ này đã thay đổi hoàn toàn tƣ duy cũ của thời đại máy tính cá
nhân, và đã loại bỏ hẳn bàn phím cứng trên nhiều thiết bị di động lẫn máy tính.
Thiết bị Kinect cũng có thể là cuộc cách mạng tiếp theo. Khi Microsoft giới thiệu,
họ coi đây là một thiết bị cách mạng trong lĩnh vực trò chơi và giải trí. Microsoft phát
hành Kinect nhƣ là một cảm biến gắn thêm vào Xbox 360 và phát triển các game
tƣơng tác bằng cử chỉ cơ thể trên hệ máy Xbox. Nhƣng ngay sau đó, ngƣời dùng và
các lập trình viên thế giới đã tìm thấy sự thú vị trong việc phát triển các ứng dụng
tƣơng tác với máy tính cá nhân sử dụng Kinect và đã bắt tay vào nghiên cứu và ứng
dụng thiết bị này trong nhiều lĩnh vực khác nhau.
Câu chuyện về quá trình thành và phát triển Kinect là một câu chuyện kể về sự tìm
tòi sáng tạo, không ngừng vƣơn lên, không nản lòng khi đối mặt với khó khăn của đội
ngũ kỹ sƣ Microsoft. Đây sẽ là một bài học bổ ích cho những cá nhân, tổ chức đang
tham gia công tác nghiên cứu khoa học và sáng tạo.
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 2
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
CHƯƠNG 1: TÌM HIỂU MICROSOFT KINECT
1. Giới thiệu về Microsoft Kinect:
Hình 1: Thiết bị Microsoft Kinect
Kinect là một thiết bị đầu vào có khả năng cảm nhận chuyển động đƣợc tạo ra bởi
Microsoft dùng cho dòng sản phẩm chính là máy chơi game Xbox 360 và máy tính
chạy hệ điều hành Windows.
Kinect có thiết kế tƣơng tự một webcam và là một thiết bị ngoại vi cho máy Xbox
360, nó cho phép ngƣời dùng điều khiển và tƣơng tác với máy Xbox 360 không cần sử
dụng thiết bị điều khiển mà thông qua chính những chuyển động tự nhiên của cơ thể
bao gồm cử chỉ và giọng nói. Mục đích chính của dự án này là để tăng trải nghiệm của
ngƣời chơi khi sử dụng Xbox 360. Phiên bản dành cho hệ điều hành Windows đƣợc
phát hành ngày 01/02/2012.
Kinect đƣợc phát hành vào ngày 04/11/2010 tại Bắc Mỹ, 10/11/2010 tại Châu Âu,
18/11/2010 tại Úc, New Zealand, Singapore và ngày 20/11/2010 tại Nhật Bản. Kinect
đƣợc bán chung một gói với máy Xbox 360 và game Kinect Adventures.
Trong 60 ngày đầu tiên, Microsoft đã bán đƣợc hơn 8 triệu sản phẩm Kinect và
Kinect đƣợc ghi nhận vào sách kỷ lục thế giới cho danh hiệu “Sản phẩm điện tử tiêu
dùng có tốc độ tiêu thụ nhanh nhất thế giới”. Tính đến tháng 01/2012, Microsoft đã
bán đƣợc 18 triệu Kinect.
Microsoft cũng đã đƣa ra bộ công cụ hỗ trợ lập trình (Software Development Kit –
SDK) cho Kinect trên hệ điều hành Windows 7 vào ngày 16/06/2011. Bộ SDK này cho
phép lập trình viên có thể xây dựng các ứng dụng tƣơng tác với Kinect bằng các ngôn
ngữ C++/CLI, C# hoặc Visual Basic .NET.
2. Lịch sử phát triển:
Kinect lần đầu tiên đƣợc giới thiệu vào ngày 01/06/2009 tại triển lãm E3 dƣới tên
mã là Project Natal. Theo truyền thống lấy tên thành phố để đặt tên mã của Microsoft,
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 3
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
Project Natal đƣợc lấy tên từ thành phố Natal của Brazil để ghi công Alex Kipman –
một giám đốc của Microsoft, ngƣời đã khai sinh ra dự án và cũng là một ngƣời có gốc
Brazil. Natal nghĩa là “một cuộc sống mới” với ngụ ý của Microsoft là “sự ra đời của
một hệ thống giải trí gia đình mới”.
Hình 2: Gian hàng của Microsoft tại triển lãm E3 - 2009
Ba game đã đƣợc trình diễn tại Microsoft‟s E3 2009 Media Briefing là Ricochet,
Paint Party và Milo & Kate. Một bản demo cho game Burnout Paradise cũng đƣợc
trình diễn bên ngoài Microsoft‟s Media Briefing. Tại E3 2009, công nghệ nhận dạng
khung xƣơng cho phép ghi nhận đƣợc 4 ngƣời cùng lúc với 48 điểm xƣơng trên cơ thể
ngƣời tại mức 30Hz.
Trong quá trình phát triển, đội phát triển đã thử nghiệm nhiều trên game khác nhau
để nâng cao khả năng của Kinect. Tiêu biểu là Beautiful Katamari và Space Invaders
Extreme, vốn đã đƣợc biểu diễn tại Tokyo Game Show tháng 09/2009. Giám đốc sáng
tạo Kudo Tsunoda của Microsoft cho biết việc đƣa hệ thống điều khiển của Kinect vào
các game cũ thông qua hệ thống cập nhật phần mềm tự động gặp rất nhiều khó khăn.
Kinect ban đầu đƣợc thiết kế riêng một bộ vi xử lý riêng nhƣng đến tháng 01/2010,
các thao tác xử lý đƣợc đảm nhận trực tiếp bởi một nhân của bộ vi xử lý Xbox 360′s
Xenon CPU. Alex Kipman cho biết Kinect sẽ chiếm 10-15% tài nguyên của Xbox 360.
Ngày 13/06/2010, Microsoft mở hội nghị “World Premiere „Project Natal‟ for the
Xbox 360 Experience” tại Galen Center. Tại đây Project Natal đã có tên gọi chính thức
là Kinect, vốn là sự kết hợp giữa “kinetic” (chuyển động) và “connect” (kết nối), cũng
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 4
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
chính là mục tiêu mà thiết bị hƣớng tới. Microsoft cũng đã thông báo ngày phát hành
tại Bắc Mỹ là 4/11/2010. Và cũng tại đây, Microsoft đã giới thiệu một thiết kế mới của
Xbox 360 tƣơng thích hoàn toàn với Kinect.
Ngày 16/06/2011, Microsoft chính thức phát hành bộ công cụ phát triển phần mềm
phi thƣơng mại cho Kinect. Tiếp theo, ngày 01/02/2012 Microsoft chính thức phát
hành phiên bản thƣơng mại của bộ công cụ phát triển phần mềm Kinect cho hơn 300
công ty của 25 nƣớc trên toàn thế giới.
3. Cấu trúc phần cứng của Kinect:
Hình 3: Cấu trúc phần cứng bên trong Kinect
Kinect đƣợc tạo ra dựa trên 2 nền tảng chính bao gồm nền tảng phát triển công
nghệ phần mềm của Rare – một nhánh của bộ phận phát triển game của Microsoft và
công nghệ camera đo chiều sâu của hãng PrimeSense tại Israel – một hãng đã phát
triển thành công hệ thống có khả năng hiểu đƣợc những chuyển động xác định và dùng
nó để điều khiển các thiết bị điện tử.
Kinect đƣợc thiết kế theo cấu trúc một thanh ngang kết nối với một trụ nhỏ bằng
một trục cơ đứng nhằm mục đích cho phép camera có thể điều chỉnh góc nhìn lên trên
hoặc xuống dƣới vị trí của camera. Thiết bị bao gồm camera ảnh RGB, một bộ cảm
biến chiều sâu hình ảnh và một bộ microphone ghi nhận âm thanh đa chiều, tất cả đƣợc
vận hành bởi một phần mềm độc quyền. Bộ microphone của Kinect có khả năng xác
định vị trí nguồn âm thanh và lọc nhiễu. Các thành phần này của Kinect cung cấp khả
năng theo dõi chuyển động toàn cơ thể ngƣời dùng trong không gian 3 chiều, nhận
diện khuôn mặt và nhận diện giọng nói.
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 5
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
Hình 4: Lƣới hồng ngoại phát ra từ Kinect
Hình 5: Bản đồ chiều sâu của hình ảnh thu về thể hiện bằng màu gradient từ trắng(gần)
đến xanh dƣơng(xa)
Bộ cảm biến chiều sâu của Kinect bao gồm một máy chiếu hồng ngoại cùng một
bộ phận cảm biến CMOS đơn sắc cho phép Kinect có thể ghi nhận hình ảnh 3 chiều
dƣới bất kỳ điều kiện ánh sáng nào. Tầm hoạt động của bộ cảm biến chiều sâu này có
thể điều chỉnh đƣợc, phần mềm của Kinect có thể tự xác định vùng cảm biến dựa trên
gameplay và môi trƣờng vật lý xung quanh ngƣời chơi qua đó loại bỏ những nội thất
trong phòng hoặc các vật cản trở tầm hoạt động.
Kinect đƣợc Microsoft đăng kí độc quyền cùng với bộ phần mềm cho phép hệ
thống có thể nhận biết cử chỉ, khuôn mặt, giọng nói một cách vƣợt bậc. Theo nhƣ các
thông tin của các hãng bán lẻ, Kinect có thể ghi nhận 6 ngƣời cùng lúc kể cả hai ngƣời
đang chơi để phân tích chuyển động của 20 khớp xƣơng mỗi ngƣời chơi.
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 6
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
Bộ cảm biến hình ảnh Kinect có dữ liệu video đầu ra với frame rate là 30Hz, độ
phân giải 32-bit VGA (640×480px). Bộ cảm biến chiều sâu có độ phân giải 16-bit
QVGA (320×240px với độ sâu 65,536 mỗi pixel) và có tầm hoạt động thực tế là từ 1.2
đến 3.5 mét. Kinect có góc quan sát là 57° theo trục ngang và 43° theo trục dọc, trong
khi đó trục cơ đứng có thể nghiêng lên xuống 27°. Bộ microphone bao gồm 4
microphone riêng lẻ cho phép Kinect ghi nhận và xử lý âm thanh dƣới dạng 16-bit với
tần số trung bình là 16 kHz.
Hình 6: Microsoft Kinect sau khi đƣợc tháo rời hoàn toàn
Kinect cần nhiều điện năng để hoạt động nên cổng USB của Xbox 360 không thể
đáp ứng mà phải qua một adapter để chia thành 2 kết nối riêng là USB và kết nối
nguồn, giúp cho thiết bị sẽ kết nối với Xbox 360 bằng cổng USB trong khi nguồn điện
sẽ đƣợc lấy từ bo mạch của Xbox qua đƣờng AC adapter. Phiên bản Xbox 360 mới sẽ
không cần adapter vì nó có các AUX port đặc biệt để cung cấp cho cổng kết nối.
4. Cấu trúc của Kinect SDK:
Microsoft cung cấp bộ thƣ viện lập trình để giúp các lập trình viên sử dụng các dữ
liệu ngôn ngữ tự nhiên của cơ thể trong thời gian thực.
Hình 7: Phần cứng và phần mềm của Kinect tƣơng tác với một ứng dụng
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 7
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
Các thành phần của SDK đƣợc thể hiện trong hình sau:
Hình 8: Cấu trúc ứng dụng Kinect để phát triển ứng dụng trên Kinect SDK
Các thành phần của SDK đƣợc thể hiện trong hình trên bao gồm:
- Phần cứng: Các thành phần của phần cứng, bao gồm các bộ cảm biến Kinect và
cổng USB mà thông qua đó cảm biến đƣợc kết nối với máy tính.
- Trình điều khiển Kinect: Các trình điều khiển của Windows 7 cho bộ cảm biến
Kinect đã đƣợc cài đặt theo SDK. Trình điều khiển này hỗ trợ:
o Các cảm biến microphone của Kinect nhƣ các thiết bị âm thanh chuẩn,
bạn có thể truy cập thông qua các API âm thanh tiêu chuẩn trong
Windows.
o Truyền dữ liệu hình ảnh bình thƣờng và hình ảnh dạng chiều sâu.
o Cho phép một ứng dụng sử dụng nhiều hơn một cảm biến Kinect đƣợc
kết nối với máy tính.
o NUI API: Một tập hợp các API để lấy dữ liệu từ các cảm biến hình ảnh
và điều khiển các thiết bị Kinect.
o KinectAudio DMO: Khả năng xử lý âm thanh bao gồm loại bỏ tiếng ồn
và tiếng vang, hình thành chùm tia để xác định nguồn âm thanh, và tích
hợp với các hàm API nhận dạng giọng nói của Windows.
o Các API chuẩn trong Windows 7: Các bộ thƣ viên về âm thanh, lời nói,
và đa phƣơng tiện nhƣ mô tả trong Windows 7 SDK và Microsoft
Speech SDK.
Video Components Audio Components
Windows
components
1
2
3
5
4
Kernel-mode drivers for Kinect for Windows
DMO codec for mic array
Applications
Kinect for
Windows SDK
User-created
components
USB Hub
Windows Core Audio
and Speech APIs
Device
setup
Audio stream controlVideo stream control
WinUSB device stack USBAudio audio stackWinUSB camera stack
Motor Audio mic arrayCameras
NUI API
A/V capture and transcoding
Media Foundation | DirectShow
User Mode
Kernel Mode
Kinect sensor
Hardware
Device
access
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 8
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
CHƯƠNG 2: CÂU CHUYỆN BÍ MẬT VỀ SỰ PHÁT TRIỂN
KINECT
Vào giữa năm 2007, Don Mattrick – ngƣời phụ trách kinh doanh giải trí tƣơng tác
của Microsoft ở Redmond – Washington đã đƣa ra yêu cầu về một hƣớng phát triển
mới cho sản phẩm Xbox 360. Trong một buổi họp hoạch định chiến lƣợc, Marc
Whitten, phó giám đốc điều hành Xbox live đã giải thích rằng họ sẽ phải thay đồi nền
tảng tƣơng tác với Xbox. Sau đó, họ đƣa ra một danh sách vắn tắt các yêu cầu: điều
khiển bằng chuyển động, nhận diện khuôn mặt, nhận dạng giọng nói và tƣơng thích
với các sản phẩm Xbox đã có trên thị trƣờng. Ý tƣởng này đã ứng dụng nguyên tắc kết
hợp trong tƣ duy sáng tạo nhằm mục đích kết hợp đồng thời cả 3 tính năng nhận dạng
cho ra một sản phẩm duy nhất.
Vấn đề đƣợc đƣa ra không chỉ có tính mơ mộng, trên thực tế việc hiện thực nó là
hoàn toàn bất khả thi. Việc tìm một chiếc camera có thể nhìn một căn phòng thì rất đơn
giản. Để có 1 sản phẩm cụ thể có khả năng giải mã đƣợc các chi của ngƣời dùng và
giọng nói dành cho 40 triệu ngƣời dùng Xbox là cả một giấc mơ. Để hiện thực hóa sản
phẩm này, thiết bị phần cứng đòi hỏi phải có một phần mềm có khả năng phân tích hơn
1023 trƣờng hợp cần xử lý bao gồm cả cử chỉ và giọng nói trong cùng một lúc mà
không gây ra bất kỳ hiện tƣợng trễ nào.
Dù sao chăng nữa, các phần riêng lẻ của sản phẩm mới gần nhƣ đã có sẵn. Trung
tâm nghiên cứu của Microsoft ở Bắc Kinh đã đạt đƣợc một số thành tựu nhất định
trong việc nhận dạng khuôn mặt. Trung tâm nghiên cứu Redmond đã phát triển phần
mềm nhận dạng giọng nói từ nhiều thập niên trƣớc. Và các kỹ sƣ phần cứng tại trung
tâm Redmond đã rất bận rộn với việc tạo ra các bản mẫu cho các bộ điều khiển dựa
trên gia tốc và chuyển động để chuẩn bị cho những sự đổi mới ở tƣơng lai. Họ đã ứng
dụng nguyên tắc sao chép trong tƣ duy sáng tạo nhằm ứng dụng những công trình
nghiên cứu đã có và tích hợp vào một sản phẩm mới. Tuy nhiên, nó vẫn luôn đòi hỏi
một sự nghiên cứu thấu đáo và chạy thử trƣớc khi bất kỳ ai có thể khẳng định rằng nó
có chạy đƣợc hay không hoặc là có tạo ra lợi nhuận hay không. Vấn đề lớn nhất gặp
phải ở đây là: việc này chƣa đƣợc thực hiện ở bất kỳ nơi nào trên cả thế giới.
Alex Kipman, 31 tuổi là ngƣời đƣợc giao nhiệm vụ hiện thực hóa yêu cầu của
Mattrick. Kipman đến từ Natal tại Brazil với 16 bằng sáng chế tại Microsoft tính từ khi
ông bắt đầu làm việc vào năm 2001. Kipman cho rằng việc đầu tiên phải làm là nghiên
cứu khả năng máy học: khả năng huấn luyện máy tính dự đoán.
Nhóm của Kipman bao gồm 15 ngƣời bắt đầu trải qua quá trình huấn luyện với các
kỹ năng hoàn toàn mới nhằm làm phong phú phƣơng pháp suy nghĩ và sáng tạo. Khóa
huấn luyện này đƣợc huấn luyện bởi các họa sĩ, nhạc sĩ, nhà thiết kế, nghiên cứu viên,
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 9
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
kỹ sƣ, một số ngƣời đến từ Hollywood, giám đốc hiệu ứng của bộ phim “Ma trận”…
Họ tóm tắt lại rằng nhiệm vụ của họ là tự đặt mình là những kẻ dễ thất bại và ngu dốt,
nó chính là động lực khiến họ làm việc cật lực nhằm đạt đƣợc những kết quả mới.
Ở một số khía cạnh, họ ít gặp phải thách thức mới hơn các khía cạnh còn lại. Ví dụ
nhƣ việc nhận dạng giọng nói đã là kết quả của một quá trình nghiên cứu lâu dài của
Microsoft. Tuy nhiên ở khía cạnh nhận diện từng ngƣời một cách chính xác dựa trên
khuôn mặt và hình dáng cơ thể thì rất khó. Kipman nói rằng: “Darwin đã chống lại
chúng tôi, mọi ngƣời ở trong một gia đình thƣờng rất giống nhau về ngoại hình. Và
chúng tôi gọi việc nhận dạng ở đây chính xác là nhận dạng đặc tính chứ không phải là
nhận dạng khuôn mặt. Việc sử dụng nhận dạng khuôn mặt ở đây hoàn toàn không đem
lại hiệu quả.”
Việc ghi nhận chuyển động của cơ thể ngƣời để nhận dạng cử chỉ và lời nói của
con ngƣời khiến máy tính phải đối mặt với khoảng 1023 trƣờng hợp có thể xảy ra.
Kipman biết rằng việc này vƣợt xa hơn khả năng lập trình một cách bình thƣờng rất
nhiều. Kipman biết rằng ông phải đƣa ra một khái niệm lập trình mới tại Microsoft và
ông ta đã làm đƣợc – khiến cho ngôn ngữ lập trình có thể mô tả và xử lý những trƣờng
hợp chƣa gặp bao giờ.
Tamir Berliner, 29 tuổi cùng 4 ngƣời khác đang làm việc tại cùng một đơn vị trực
thuộc bộ quốc phòng Israel là những nhà đồng sáng lập PrimeSense. Thành lập vào
tháng 05/2005, Tel Aviv – tiền thân của PrimeSense có 130 nhân viên và mở ra hơn 5
chi nhánh trên toàn Châu Á. Họ tìm cách giải quyết vấn đề sử dụng một bộ cảm biến
chiều sâu để để nhận dạng một ngƣời đang chuyển động. Họ đã ứng dụng nguyên tắc
sao chép và nguyên tắc tự phục vụ trong tƣ duy sáng tạo bằng cách sử dụng một bộ
phát hồng ngoại và một bộ thu hình ảnh hồng ngoại để thu lại lƣới hồng ngoại thiết bị
đã phát ra và dựa trên đó xây dựng chiều sâu của từng điểm ảnh. Berliner cho biết bản
thân họ cũng là những game thủ và học nhận thấy việc chơi game trên máy tính rất
nhàm chán, họ muốn họ có thể thực hiện các thao tác của nhân vật trong game để điều
khiển chính nhân vật của mình.
Giới thiệu sản phẩm lần đầu tiên vào tháng 03/2006, hai tháng sau, PrimeSense
đƣa bản nâng cấp của sản phẩm đến hội chợ E3 ở Los Angeles – một hộp nhựa màu
trắng, dài 30cm, rộng 10cm, bao gồm 1 camera RGB, một cảm biến hồng ngoại và một
nguồn sáng. Khi lần đầu tiên Kipman đƣợc nhìn thấy sản phẩm này, ông ta đã nhanh
chóng nhận ra đƣợc những gì có thể làm với thiết bị này.
Team Xbox đã bí mật ký hợp đồng với PrimeSense – cung cấp chip cảm biến
chiều sâu và các thiết kế liên quan. Tại đây, nguyên tắc phân nhỏ và nguyên tắc lấy
“rẻ” thay cho “đắt” trong tƣ duy sáng tạo đã đƣợc áp dụng nhằm mục đích thu nhỏ bộ
camera cảm biến và hạ giá thành sản phẩm. Raghu Murthi – giám đốc bộ phận sản
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 10
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
xuất phần cứng cho Xbox - cho hay: “Các thiết bị phần cứng phải đƣợc thu nhỏ tối đa
và gần nhƣ không tồn tại trong con mắt ngƣời dùng. Qua đó, ngƣời dùng có thể tƣơng
tác với hệ thống nhƣng không thể biết rằng Microsoft đã làm điều đó bằng cách nào.”
Vào đầu năm 2008, Kudo Tsunoda, 36 tuổi, tham gia vào bộ phận phát triển game
của Microsoft từ Electronic Arts để phát triển Gears of War 2. Trong một buổi họp
giới thiệu Tsunoda với các đồng nghiệp tại Redmond, Kipman đến và mang theo thiết
bị đƣợc tạo ra dựa trên bộ camera cảm biến của PrimeSense. Kipman mô tả về sản
phẩm này một cách rất đơn giản – nó thể hiện góc nhìn 3 chiều, không âm thanh,
không RGB – nhƣng ngay lập tức Tsunoda đã hoàn toàn bị chinh phục. Anh ta nhắc đi
nhắc lại rằng: “Đây quả thực là một điều tuyệt vời, chúng ta có thể làm hàng trăm thứ
với thiết bị này.” Cuộc họp của họ đã kéo dài hơn 4 tiếng đồng hồ.
Sau đó, sự phấn khích của Tsunoda đã giảm bớt ngay sau một phép thử thực tế.
Tsunoda gọi lại cho Kipman và cho rằng họ không thể làm đƣợc bởi vì họ có thể theo
dõi chuyển động nhƣng các chuyển động này không có gia tốc nhất định và có rất
nhiều dạng chuyển động khác nhau. Tuy nhiên họ cũng thống nhất rằng họ có thể tích
hợp microphone để nhận dạng giọng nói và một camera RGB để giúp ngƣời chơi có
thể nhìn thấy chính mình một cách rõ ràng trên màn hình. Nguyên tắc kết hợp trong tƣ
duy sáng tạo đã đƣợc áp dụng nhằm tạo ra một thiết bị với nhiều tính năng hơn.
Cũng giống nhƣ Kipman, Tsunoda cũng có một nhóm nghiên cứu đã có kinh
nghiệm tạo bản mẫu cho khoảng 70 game. Khi team của Kipman tạo ra bản mẫu cho
một khung xƣơng di chuyển dựa trên cấu trúc cơ thể ngƣời, họ kết hợp cùng làm việc
với team của Tsunoda. Nhận dạng con ngƣời lúc nào cũng là một rào cản lớn đối với
họ và việc nhận dạng âm thanh cũng gặp khó khăn trong quá trình khử nhiễu.
Nhóm của Kipman và Tsunoda làm việc chung với nhau và đối mặt với deadline
vào ngày 18/08/2008, một cuộc họp với các nhân viên của Microsoft và quyết định
tính sống còn của dự án. Họ mang đến một bộ cảm biến và nói với mọi ngƣời rằng:
“Chúng tôi sẽ không nói bất cứ điều gì về mặt công nghệ. Chúng tôi không nói chúng
tôi đã làm những gì. Tất cả những gì bạn cần làm là trải nghiệm nó, hãy ngồi xuống và
chơi. Nó là một chiếc ô tô, hãy lái nó theo cách bạn thƣờng lái.” Marc Whitten đã mỉm
cƣời, cuộc họp trở nên sáng sủa khi những công nghệ sử dụng đƣợc Kipman giải thích.
Mọi ngƣời đều nhận thấy sức mạnh của công nghệ mới này. Kipman đã có thêm thời
gian nhƣng nhiều câu hỏi lớn vẫn chƣa đƣợc giải đáp.
Giáo sƣ Blake, 54 tuổi, làm việc tại trung tâm nghiên cứu của Microsoft tại
Cambridge từ năm 1999 đã có 32 bằng sáng chế cho Microsoft. Ông là một trong
những chuyên gia đi đầu của thế giới trong lĩnh vực thị giác máy (Computer Vision).
Ông nổi tiếng với các nghiên cứu nhƣ theo dõi nhịp đập tim thông qua hình ảnh, công
cụ tẩy nền của hình ảnh trong Office 2010, hệ thống tìm kiếm bằng lazer cho phép máy
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 11
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
bay trực thăng quân đội theo dõi mặt đất… Vào năm 2001, Blake xuất bản một bài báo
khoa học cùng với một nhà nghiên cứu khác của Microsoft tên là Kentaro Toyama. Bài
báo đƣa ra một hƣớng tiếp cận mới để theo dõi sự chuyển động của các vật thể.
Tên của bài báo là “Probabilistic Tracking in a Metric Space”, bài báo đã giả dụ
rằng chuyển động của một vũ công ba lê có thể đƣợc theo dõi bằng cách đƣa ra một
xác suất có thể để một khung hình có thể đi đến một khung hình kế tiếp (có thể hiểu là
dự đoán trƣớc chuyển động dựa trên xác suất thống kê). Nguyên tắc giải “thiếu” đã
đƣợc Blake áp dụng để đƣa ra một kết quả mang tính gần đúng cho bài toán. Bằng
cách nhập vào các dữ liệu thô mô tả di chuyển của vũ công tại mỗi khung hình, hệ
thống máy tính có thể đƣa ra đƣợc khung hình kế tiếp gần đúng nhất so với chuyển
động của vũ công.
Hƣớng tiếp cận này đƣợc Blake mô tả “nhƣ là một cuốn tranh lật hoạt hình với các
tƣ thế nguyên mẫu” đã tạo ra một làn sóng mới trong lĩnh vực nghiên cứu máy học và
đoạt giải thƣởng Marr. Nó cũng gây ảnh hƣởng đến một post-doc đang làm việc tại
Oxford tên là Andrew Fitzgibbon, một chuyên gia trong lĩnh vực thị giác máy. Vào
năm 2007, Fitzgibbon, 42 tuổi đã xuất bản một bài báo “The Joint Manifold Model for
Semi-supervised Multi-valued Regression” mô tả cách sử dụng xác suất để dự đoán
chuyển động của cơ thể. Tuy nhiên hƣớng tiếp cận này gặp phải một rào cản khá lớn
đó là: nó chỉ hoạt động đƣợc với khoảng 50 chuyển động của cơ thể, thời gian xử lý rất
chậm – mất khoảng 1 phút để đƣa ra khung hình tiếp theo của chuyển động.
Tại điểm này, nhóm của Kipman tìm thấy một bài báo từ Toshiba – nơi mà các nhà
nghiên cứu đang cố gắng theo dõi chuyển động theo thời gian thực với một camera
bình thƣờng chứ không phải một camera 3 chiều. Blake nói rằng họ đã dựa trên nghiên
cứu của ông và Toyama và mở rộng phạm vi của nó lên. Cuốn tranh lật hoạt hình của
Blake chỉ có khoảng 100 trang nay đã lên tới 50,000 trang dƣới nghiên cứu của
Toshiba và có thể theo dõi tất cả các trạng thái của cơ thể.
Tuy nhiên các nghiên cứu của Toshiba đã đƣợc Blake cho rằng chƣa thể ứng dụng
đƣợc bởi vì hoán vị các chuyển động của cơ thể là quá lớn dẫn đến việc áp dụng xác
suất không đem lại hiệu quả. “Nếu mỗi điểm của cơ thể đƣợc chia làm 10 bộ góc, có
tới 1030 khả năng cho chuyển động kế tiếp. Nó sẽ không chính xác.”, Blake nói.
Câu trả lời cho bài toán đến từ nghiên cứu tiến sĩ của Jamie Shotton, một nhà
nghiên cứu mới ra trƣờng làm việc tại bộ phận của Blake. Shotton đã khiến cho máy
tính có khả năng phân biệt bò, cỏ hoặc máy bay trong một tấm hình đồng quê bằng
cách cho máy tính học theo từng pixel một. Anh ta đã huấn luyện cho máy tính có khả
năng nhận diện 21 danh mục vật thể khác nhau.
Một cách tình cờ, Kipman đã đọc đƣợc bài báo của Shotton viết về việc theo dõi
cử động của bàn tay. Kipman nhận xét rằng bài viết đƣợc viết khá chi tiết và mang tính
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 12
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
lạc quan. Vào ngày 18/08/2008, Kipman đã gọi cho Shotton và trình bày ý tƣởng của
mình. Shotton đã bàn luận với Fitzgibbon và nhận đƣợc câu trả lời rằng ý tƣởng đó
không thể hiện thực đƣợc. Nhóm của Kipman đã chủ động mang thiết bị bay tới
Cambridge và cho Shotton xem khả năng của bộ camera cảm biến 3 chiều. Màn hình
cho thấy một bộ khung ngƣời đang đựa vẽ lên trên một bộ nền, bộ nền hiển thị những
gì bộ cảm biến chiều sâu nhìn thấy. Một khi hệ thống nhân dạng đƣợc hình dáng cơ thể
ngƣời, nó sẽ vẽ lên bộ khung tƣơng ứng.
Vấn đề gặp phải với bộ xƣơng ở đây là cơ thể ngƣời luôn chuyển động một cách
không thể dự đoán trƣớc và các chuyển động này không hoàn toàn giống nhau. Vì vậy
hệ thống thƣờng xuyên bị lỗi khi tay, chân hoặc đầu chuyển động. Nếu họ quay lại sử
dụng phƣơng pháp của Blake, dữ liệu huấn luyện sẽ rất lớn và dữ liệu này sẽ không
phù hợp với bộ nhớ của Kinect. Họ bắt đầu suy nghĩ đến phƣơng pháp chia cơ thể ra
làm nhiều phần khác nhau. Tại đây, nguyên tắc phân nhỏ trong tƣ duy sáng tạo đã
đƣợc áp dụng. Cuối cùng Shotton quyết định quay lại nghiên cứu giải pháp cũ trong
việc cho máy tính học theo từng pixel. Đây chính là khoảnh khắc đột phá: nếu hệ
thống đƣợc huấn luyện để nhận dạng từng phần riêng biệt của cơ thể - với sự trợ giúp
của bộ cảm biến chiều sâu – hệ thống sẽ nhận dạng đƣợc chuyển động trong bất kỳ
trạng thái nào.
Fitzgibbon chạy một đoạn video mô tả các bộ phận của cơ thể ngƣời cánh tay trái
xuống đến bàn chân phải đã đƣợc tô màu, mỗi một bộ màu chuyển động cùng với cơ
thể khi nó di chuyển. 31 phần của cơ thể khác nhau có 31 màu khác nhau. Nguyên tắc
thay đổi màu sắc trong tƣ duy sáng tạo đã đƣợc áp dụng để đánh dấu các bộ phận khác
nhau cảu cơ thể sau khi phân nhỏ. Shotton cho rằng nếu có thể huấn luyện hệ thống
với hàng triệu trạng thái chuyển động khác nhau của cơ thể, bạn có thể điều chỉnh
thuật toán sao cho nó có thể bỏ qua các giai đoạn bạn thay đổi từ trạng thái chuyển
động này sang trạng thái chuyển động khác, hoặc là hình dạng của bạn (mập lên hay
ốm đi) và lƣu giữ thông tin quan trọng nhất đó là điểm ảnh đó thuộc về bộ phận nào
của cơ thể. Những chuyển động của ngón tay cũng có thể đƣợc giải quyết vì giới hạn
độ phân giải của camera ngày nay đã đƣợc mở rộng.
Họ đặt tên cho hệ thống mới này là hệ thống “Exemplar” và bắt đầu huấn luyện
thuật toán với 100 tấm ảnh con ngƣời do máy tính sinh ra. Vào tháng 06/2009, hệ
thống đã sẵn sàng để đƣợc công bố tại triển lãm E3 ở Los Angeles. Sáu tháng sau,
nhóm đã bàn giao lại kết quả nghiên cứu cho nhóm nghiên cứu ở Redmond. Shotton đã
không đƣợc chơi thử bất kỳ game nào cho đến tháng 08/2010 và anh ta đã rất ngạc
nhiên với những gì mà nhóm nghiên cứu ở Redmond đã làm đƣợc. Riêng Blake, niềm
vui thú lớn nhất của ông là dự án này đã mở ra tƣơng lai của việc tƣơng tác ngƣời –
máy.
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 13
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
Dự án máy học này tiếp tục phát triển và đƣợc phát triển phần mềm bởi nhóm của
Ben Kilgore. “Chúng tôi chia mọi thứ làm 3-4 vấn đề chính để giải quyết, mỗi vấn đề
chính bao gồm khoảng 20 vấn đề nhỏ”, Kilgore nói. Trong vấn đề nhận dạng giọng
nói, công việc rất nhiều, họ phải xây dựng các mô hình âm học riêng cho ngôn ngữ của
từng nƣớc mà sản phẩm của họ có hỗ trợ. Một lần nữa, nguyên tắc phân nhỏ trong tƣ
duy sáng tạo lại tiếp tục đƣợc ứng dụng trong việc giải quyết vấn đề.
Tại thời điểm này, việc kiểm thử một cách khắt khe là vấn đề sống còn của phần
cứng, phần mềm và game cho thiết bị đã bắt đầu đƣợc phát triển. Việc kiểm thử phần
cứng bao gồm cho phép ngƣời chơi sử dụng trong các điều kiện nhiệt độ, độ ẩm và ánh
sáng khác nhau. Nguyên tắc gây ứng suất sơ bộ đã đƣợc áp dụng trong quá trình kiểm
thử phần cứng nhằm tránh những sai sót không mong muốn khi đặt thiết bị trong
những môi trƣờng khác nhau. Raghu Murthi cho biết việc kiểm thử đƣợc thực hiện
trong các lò hấp lớn để có thể đƣa ra các điều kiện nhiệt độ cao thấp khác nhau, việc
kiểm thử hệ thống microphone và hệ thống âm thanh đƣợc thực hiện trong các tòa nhà
không có tiếng vang và không có âm thanh ảnh hƣởng từ bên ngoài.
Nhóm của Kipman và Tsunoda đã gặp Andreas – giám đốc sáng tạo của Rare, 39
tuổi với 15 năm kinh nghiệm làm việc tại Rare và đã trình bày với anh ta những gì họ
đã làm đƣợc cho đến lúc này. Và khi Burton - giám đốc điều hành của Rare theo dõi
màn hình với bộ xƣơng của chính mình đang di chuyển theo từng cử động của anh ta,
Burton đã rất khiếp sợ. Anh ta nói: “Đó là khoảnh khắc Natal của chúng tôi, tôi đƣợc
điều khiển bộ xƣơng của chính mình, thật là một điều kì diệu. Tôi đã ngồi tại văn
phòng của Kudo cho đến khi anh ta đƣa cho chúng tôi bộ công cụ phát triển phần mềm
cho thiết bị đó, tôi mới chịu rời khỏi.”
Họ trở về và bắt đầu tạo bản mẫu cho các trò chơi. Andreas đã từng là một cầu thủ
bóng đá bán chuyên nghiệp tại đội Crystal Palace và nhận thấy họ có thể phát triển trò
chơi đá bóng trong 3 chiều. Anh ta cho rằng việc dắt bóng rất phức tạp và nếu họ làm
đƣợc thì sẽ chứng minh đƣợc sức mạnh công nghệ của họ. Vậy là họ bắt đầu xây dựng
bản mẫu cho trò chơi đá bóng và đã thành công.
Vào Noel năm 2008, họ tập trung vào việc thực hiện 3 ý tƣởng chính và một trong
số đó là thể thao. Andreas cho biết họ muốn cạnh tranh trực tiếp với Wii Sports. Do
mục tiêu của họ là thị trƣờng khách hàng gia đình nên họ chọn các môn thể thao thông
dụng nhất. Họ tạo bản mẫu cho khoảng 20 môn thể thao từ đua ngựa đến đua xe đạp
trong đó tập trung nhất vẫn là trò chơi đá bóng.
Các lập trình viên gặp phải những khó khăn nhất định khi chuyển môi trƣờng làm
việc từ PC sang Xbox. Riêng đối với trò chơi đá bóng, việc theo dõi chuyển động chân
thiếu độ chính xác và độ trễ bị tăng lên bởi vì những điển đó nằm ở vị trí thấp nhất của
cơ thể. Vấn đề này mất 3 tháng để giải quyết. Andreas vui mừng: “Chƣa tới 2 năm,
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 14
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
chúng tôi đã có công nghệ mới, phần mềm mới, thiết bị mới và một định nghĩa khác
khi nói đến trò chơi.”
Một khu vực rông khoảng 36 hecta trong công viên Warwichshire đƣợc sử dụng
để kiểm tra khả năng của Kinect. Trong ngày cuối cùng sửa lỗi trò chơi Kinect Sports,
và trong một chuỗi các tòa nhà xung quanh văn phòng trung tâm, rất nhiều ngƣời trong
số 200 nhân viên của công ty đang đổ mồ hôi một cách đúng nghĩa để bảo đảm rằng 10
môn thể thao tích hợp trong game này từ bowling đến boxing đã sẵn sàng để ra mắt
vào ngày 04/11 tại Mỹ và 6 ngày sau tại Châu Âu.
Tại phòng kiểm thử ở tầng dƣới, hai ngƣời phụ nữ trong trang phục thể thao đang
chơi bóng bàn bằng cách quơ tay một cách điên cuồng trong không khí và một ngƣời
phụ nữ khác đấm bốc một cách hăng hái vào không khí. Trên tầng trên, nơi mà các nhà
phát triển ngồi cùng với các nhà thiết kế, lập trình viên và các nhà quản lý, khung cảnh
hiện ra rất kỳ quái: một ngƣời đang chạy tại chỗ ngay cửa phòng của anh ta, một ngƣời
la to “Goal kick!” và ngƣời thứ 3 hiện ra với các cử chỉ biểu hiện rằng anh ta đang cố
gắng ném đi một cây lao trong tƣởng tƣợng. Burton cho biết đây là nơi mà chiếc
Kinect đầu tiên bị hƣ. Đồng nghiệp của anh ta, Andreas cho biết: “Tòa nhà này là nơi
mà bạn có thể tìm thấy nhiều Kinect nhất tại đất nƣớc này.”
“Vào ngày 04/11, đó sẽ không phải là ngày mà Kinect dừng lại sự phát triển của
nó, tất cả chỉ mới là sự bắt đầu.”
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 15
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
CHƯƠNG 3: KẾT LUẬN
Kinect tuy là một sản phẩm hoàn toàn mang tính thƣơng mại nhƣng có thể xem
nhƣ một biểu tƣợng cho sự sáng tạo và khả năng khám phá của con ngƣời trong thế kỷ
21. Nó đã mở ra một kỷ nguyên mới trong việc tƣơng tác ngƣời-máy và mở ra các
hƣớng phát triển mới trong các lĩnh vực y tế, giáo dục, quốc phòng…
Qua câu chuyện về sự hình thành và phát triển của Kinect, chúng ta nhận thấy mọi
điều kỳ diệu đều xuất phát từ ý tƣởng. Một ý tƣởng tốt nếu đƣợc đầu tƣ một cách đúng
đắn sẽ từng bƣớc đi đến thành công. Bên cạnh đó, việc nghiên cứu cần có sự hỗ trợ đắc
lực của các cá nhân, tổ chức có cùng định hƣớng nghiên cứu nhằm đạt đƣợc một mục
đích chung.
Với Kinect, cá nhân tiêu biểu cho sự thành công của dự án này là Kipman, ông đã
không ngừng tìm tòi, nghiên cứu và ứng dụng các giải pháp để có lời giải cuối cùng
cho bài toán của mình. Câu chuyện cũng cho thấy việc bồi dƣỡng các kỹ năng tƣ duy
sáng tạo là một bƣớc tiến nhằm thay đổi các lối mòn trong suy nghĩ và đƣa chúng ta
đến gần với những giải pháp mới để giải quyết vấn đề một cách chính xác và hoàn
thiện hơn.
Chúng ta cũng thấy rõ sự thành công của dự án này cũng có một phần đóng góp
không nhỏ về tiềm lực tài chính cũng nhƣ tiềm lực về công nghệ đã nghiên cứu trƣớc
của Microsoft. Dựa trên đó, chúng ta phải hiểu rằng việc nghiên cứu trƣớc hết phải dựa
trên cơ sở vững chắc về kiến thức cơ bản và khả năng nắm bắt công nghệ mới, tiềm lực
tài chính cũng là một động lực thúc đẩy sự thành công của công tác nghiên cứu và sáng
tạo.
----- o0o -----
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 16
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
PHỤ LỤC
(Các nguyên tắc tƣ duy sáng tạo đã đƣợc phân tích trong bài viết)
1) Nguyên tắc phân nhỏ:
Chia đối tƣợng thành các phần độc lập.
Làm đối tƣợng trở nên tháo lắp đƣợc.
Tăng mức độ phân nhỏ đối tƣợng.
2) Nguyên tắc kết hợp:
Kết hợp các đối tƣợng đồng nhất hoặc các đối tƣợng dùng cho các hoạt động kế
cận.
Kết hợp về mặt thời gian các hoạt động đồng nhất hoặc kế cận.
3) Nguyên tắc gây ứng suất sơ bộ:
Gây ứng suất trƣớc với đối tƣợng để chống lại ứng suất không cho phép hoặc
không mong muốn khi đối tƣợng làm việc ( hoặc gây ứng suất trƣớc để khi làm
việc sẽ dùng ứng suất ngƣợc lại ).
4) Nguyên tắc giải “thiếu” hoặc “thừa”:
Nếu nhƣ khó nhận đƣợc 100 hiệu quả cần thiết, nên nhận ít hơn hoặc nhiều
hơn “một chút”. Lúc đó bài toán có thể trở nên đơn giản hơn và dễ giải hơn.
5) Nguyên tắc tự phục vụ
Đối tƣợng phải tự phục vụ bằng cách thực hiện các thao tác phụ trợ, sửa chữa.
Sử dụng phế liệu, chát thải, năng lƣợng dƣ.
6) Nguyên tắc sao chép ( copy)
Thay vì sử dụng những cái không đƣợc phép, phức tạp, đắt tiền, không tiện lợi
hoặc dễ vỡ, sử dụng bản sao.
Thay thế đối tƣợng hoặc hệ các đối tƣợng bằng bản sao quang học (ảnh, hình
vẽ) với các tỷ lệ cần thiết.
Nếu không thể sử dụng bản sao quang học ở vùng biểu kiến ( vùng ánh sáng
nhìn thấy đƣợc bằng mắt thƣờng ), chuyển sang sử dụng các bản sao hồng ngoại
hoặc tử ngoại.
7) Nguyên tắc “rẻ” thay cho “đắt”:
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 17
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
Thay thế đối tƣợng đắt tiền bằng bộ các đối tƣợng rẻ có chất lƣợng kém hơn (thí
dụ nhƣ về tuổi thọ).
8) Nguyên tắc thay đổi màu sắc:
Thay đổi màu sắc của đối tƣợng hay môi trƣờng bên ngoài.
Thay đổi độ trong suốt của của đối tƣợng hay môi trƣờng bên ngoài.
Để có thể quan sát đƣợc những đối tƣợng hoặc những quá trình, sử dụng các
chất phụ gia màu, hùynh quang.
Nếu các chất phụ gia đó đã đƣợc sử dụng, dùng các nguyên tử đánh dấu.
Sử dụng các hình vẽ, ký hiệu thích hợp.
Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 18
GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
TÀI LIỆU THAM KHẢO
Tiếng Việt:
[1]. Giáo trình sơ cấp tóm tắt: Phương pháp luận sáng tạo khoa học – kỹ thuật giải
quyết vấn đề và ra quyết định, Phan Dũng (1994), Trung tâm sáng tạo KHKT –
Tp.HCM.
[2]. Phương pháp luận nghiên cứu khoa học, Vũ Cao Đàm (2001), Nhà xuất bản Đại
học Hà Nội.
[3].Slide Phương pháp luận sáng tạo khoa học, Hoàng Văn Kiếm (2011), Đại học
Công nghệ Thông tin - ĐHQG Tp.HCM.
Tiếng Anh:
[4].Website:
[5].Website:
Các file đính kèm theo tài liệu này:
- tieuluanpplstkh_ch1101159_4554.pdf