Restore SCSI disk attaching, by Igor Kovalenko.
[qemu] / block-raw.c
1 /*
2  * Block driver for RAW files
3  * 
4  * Copyright (c) 2006 Fabrice Bellard
5  * 
6  * Permission is hereby granted, free of charge, to any person obtaining a copy
7  * of this software and associated documentation files (the "Software"), to deal
8  * in the Software without restriction, including without limitation the rights
9  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
10  * copies of the Software, and to permit persons to whom the Software is
11  * furnished to do so, subject to the following conditions:
12  *
13  * The above copyright notice and this permission notice shall be included in
14  * all copies or substantial portions of the Software.
15  *
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
17  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
18  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
19  * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
20  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
21  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
22  * THE SOFTWARE.
23  */
24 #include "vl.h"
25 #include "block_int.h"
26 #include <assert.h>
27 #ifndef _WIN32
28 #include <aio.h>
29
30 #ifndef QEMU_TOOL
31 #include "exec-all.h"
32 #endif
33
34 #ifdef CONFIG_COCOA
35 #include <paths.h>
36 #include <sys/param.h>
37 #include <IOKit/IOKitLib.h>
38 #include <IOKit/IOBSD.h>
39 #include <IOKit/storage/IOMediaBSDClient.h>
40 #include <IOKit/storage/IOMedia.h>
41 #include <IOKit/storage/IOCDMedia.h>
42 //#include <IOKit/storage/IOCDTypes.h>
43 #include <CoreFoundation/CoreFoundation.h>
44 #endif
45
46 #ifdef __sun__
47 #define _POSIX_PTHREAD_SEMANTICS 1
48 #include <signal.h>
49 #include <sys/dkio.h>
50 #endif
51 #ifdef __linux__
52 #include <sys/ioctl.h>
53 #include <linux/cdrom.h>
54 #include <linux/fd.h>
55 #endif
56 #ifdef __FreeBSD__
57 #include <sys/disk.h>
58 #endif
59
60 //#define DEBUG_FLOPPY
61
62 #define FTYPE_FILE   0
63 #define FTYPE_CD     1
64 #define FTYPE_FD     2
65
66 /* if the FD is not accessed during that time (in ms), we try to
67    reopen it to see if the disk has been changed */
68 #define FD_OPEN_TIMEOUT 1000
69
70 typedef struct BDRVRawState {
71     int fd;
72     int type;
73 #if defined(__linux__)
74     /* linux floppy specific */
75     int fd_open_flags;
76     int64_t fd_open_time;
77     int64_t fd_error_time;
78     int fd_got_error;
79     int fd_media_changed;
80 #endif
81 } BDRVRawState;
82
83 static int fd_open(BlockDriverState *bs);
84
85 static int raw_open(BlockDriverState *bs, const char *filename, int flags)
86 {
87     BDRVRawState *s = bs->opaque;
88     int fd, open_flags, ret;
89
90     open_flags = O_BINARY;
91     if ((flags & BDRV_O_ACCESS) == O_RDWR) {
92         open_flags |= O_RDWR;
93     } else {
94         open_flags |= O_RDONLY;
95         bs->read_only = 1;
96     }
97     if (flags & BDRV_O_CREAT)
98         open_flags |= O_CREAT | O_TRUNC;
99
100     s->type = FTYPE_FILE;
101
102     fd = open(filename, open_flags, 0644);
103     if (fd < 0) {
104         ret = -errno;
105         if (ret == -EROFS)
106             ret = -EACCES;
107         return ret;
108     }
109     s->fd = fd;
110     return 0;
111 }
112
113 /* XXX: use host sector size if necessary with:
114 #ifdef DIOCGSECTORSIZE
115         {
116             unsigned int sectorsize = 512;
117             if (!ioctl(fd, DIOCGSECTORSIZE, &sectorsize) &&
118                 sectorsize > bufsize)
119                 bufsize = sectorsize;
120         }
121 #endif
122 #ifdef CONFIG_COCOA
123         u_int32_t   blockSize = 512;
124         if ( !ioctl( fd, DKIOCGETBLOCKSIZE, &blockSize ) && blockSize > bufsize) {
125             bufsize = blockSize;
126         }
127 #endif
128 */
129
130 static int raw_pread(BlockDriverState *bs, int64_t offset, 
131                      uint8_t *buf, int count)
132 {
133     BDRVRawState *s = bs->opaque;
134     int ret;
135     
136     ret = fd_open(bs);
137     if (ret < 0)
138         return ret;
139
140     lseek(s->fd, offset, SEEK_SET);
141     ret = read(s->fd, buf, count);
142     return ret;
143 }
144
145 static int raw_pwrite(BlockDriverState *bs, int64_t offset, 
146                       const uint8_t *buf, int count)
147 {
148     BDRVRawState *s = bs->opaque;
149     int ret;
150     
151     ret = fd_open(bs);
152     if (ret < 0)
153         return ret;
154
155     lseek(s->fd, offset, SEEK_SET);
156     ret = write(s->fd, buf, count);
157     return ret;
158 }
159
160 /***********************************************************/
161 /* Unix AIO using POSIX AIO */
162
163 typedef struct RawAIOCB {
164     BlockDriverAIOCB common;
165     struct aiocb aiocb;
166     struct RawAIOCB *next;
167 } RawAIOCB;
168
169 static int aio_sig_num = SIGUSR2;
170 static RawAIOCB *first_aio; /* AIO issued */
171 static int aio_initialized = 0;
172
173 static void aio_signal_handler(int signum)
174 {
175 #ifndef QEMU_TOOL
176     CPUState *env = cpu_single_env;
177     if (env) {
178         /* stop the currently executing cpu because a timer occured */
179         cpu_interrupt(env, CPU_INTERRUPT_EXIT);
180 #ifdef USE_KQEMU
181         if (env->kqemu_enabled) {
182             kqemu_cpu_interrupt(env);
183         }
184 #endif
185     }
186 #endif
187 }
188
189 void qemu_aio_init(void)
190 {
191     struct sigaction act;
192
193     aio_initialized = 1;
194     
195     sigfillset(&act.sa_mask);
196     act.sa_flags = 0; /* do not restart syscalls to interrupt select() */
197     act.sa_handler = aio_signal_handler;
198     sigaction(aio_sig_num, &act, NULL);
199
200 #if defined(__GLIBC__) && defined(__linux__)
201     {
202         /* XXX: aio thread exit seems to hang on RedHat 9 and this init
203            seems to fix the problem. */
204         struct aioinit ai;
205         memset(&ai, 0, sizeof(ai));
206         ai.aio_threads = 1;
207         ai.aio_num = 1;
208         ai.aio_idle_time = 365 * 100000;
209         aio_init(&ai);
210     }
211 #endif
212 }
213
214 void qemu_aio_poll(void)
215 {
216     RawAIOCB *acb, **pacb;
217     int ret;
218
219     for(;;) {
220         pacb = &first_aio;
221         for(;;) {
222             acb = *pacb;
223             if (!acb)
224                 goto the_end;
225             ret = aio_error(&acb->aiocb);
226             if (ret == ECANCELED) {
227                 /* remove the request */
228                 *pacb = acb->next;
229                 qemu_aio_release(acb);
230             } else if (ret != EINPROGRESS) {
231                 /* end of aio */
232                 if (ret == 0) {
233                     ret = aio_return(&acb->aiocb);
234                     if (ret == acb->aiocb.aio_nbytes)
235                         ret = 0;
236                     else
237                         ret = -EINVAL;
238                 } else {
239                     ret = -ret;
240                 }
241                 /* remove the request */
242                 *pacb = acb->next;
243                 /* call the callback */
244                 acb->common.cb(acb->common.opaque, ret);
245                 qemu_aio_release(acb);
246                 break;
247             } else {
248                 pacb = &acb->next;
249             }
250         }
251     }
252  the_end: ;
253 }
254
255 /* Wait for all IO requests to complete.  */
256 void qemu_aio_flush(void)
257 {
258     qemu_aio_wait_start();
259     qemu_aio_poll();
260     while (first_aio) {
261         qemu_aio_wait();
262     }
263     qemu_aio_wait_end();
264 }
265
266 /* wait until at least one AIO was handled */
267 static sigset_t wait_oset;
268
269 void qemu_aio_wait_start(void)
270 {
271     sigset_t set;
272
273     if (!aio_initialized)
274         qemu_aio_init();
275     sigemptyset(&set);
276     sigaddset(&set, aio_sig_num);
277     sigprocmask(SIG_BLOCK, &set, &wait_oset);
278 }
279
280 void qemu_aio_wait(void)
281 {
282     sigset_t set;
283     int nb_sigs;
284
285 #ifndef QEMU_TOOL
286     if (qemu_bh_poll())
287         return;
288 #endif
289     sigemptyset(&set);
290     sigaddset(&set, aio_sig_num);
291     sigwait(&set, &nb_sigs);
292     qemu_aio_poll();
293 }
294
295 void qemu_aio_wait_end(void)
296 {
297     sigprocmask(SIG_SETMASK, &wait_oset, NULL);
298 }
299
300 static RawAIOCB *raw_aio_setup(BlockDriverState *bs,
301         int64_t sector_num, uint8_t *buf, int nb_sectors,
302         BlockDriverCompletionFunc *cb, void *opaque)
303 {
304     BDRVRawState *s = bs->opaque;
305     RawAIOCB *acb;
306
307     if (fd_open(bs) < 0)
308         return NULL;
309
310     acb = qemu_aio_get(bs, cb, opaque);
311     if (!acb)
312         return NULL;
313     acb->aiocb.aio_fildes = s->fd;
314     acb->aiocb.aio_sigevent.sigev_signo = aio_sig_num;
315     acb->aiocb.aio_sigevent.sigev_notify = SIGEV_SIGNAL;
316     acb->aiocb.aio_buf = buf;
317     acb->aiocb.aio_nbytes = nb_sectors * 512;
318     acb->aiocb.aio_offset = sector_num * 512;
319     acb->next = first_aio;
320     first_aio = acb;
321     return acb;
322 }
323
324 static BlockDriverAIOCB *raw_aio_read(BlockDriverState *bs,
325         int64_t sector_num, uint8_t *buf, int nb_sectors,
326         BlockDriverCompletionFunc *cb, void *opaque)
327 {
328     RawAIOCB *acb;
329
330     acb = raw_aio_setup(bs, sector_num, buf, nb_sectors, cb, opaque);
331     if (!acb)
332         return NULL;
333     if (aio_read(&acb->aiocb) < 0) {
334         qemu_aio_release(acb);
335         return NULL;
336     } 
337     return &acb->common;
338 }
339
340 static BlockDriverAIOCB *raw_aio_write(BlockDriverState *bs,
341         int64_t sector_num, const uint8_t *buf, int nb_sectors,
342         BlockDriverCompletionFunc *cb, void *opaque)
343 {
344     RawAIOCB *acb;
345
346     acb = raw_aio_setup(bs, sector_num, (uint8_t*)buf, nb_sectors, cb, opaque);
347     if (!acb)
348         return NULL;
349     if (aio_write(&acb->aiocb) < 0) {
350         qemu_aio_release(acb);
351         return NULL;
352     } 
353     return &acb->common;
354 }
355
356 static void raw_aio_cancel(BlockDriverAIOCB *blockacb)
357 {
358     int ret;
359     RawAIOCB *acb = (RawAIOCB *)blockacb;
360     RawAIOCB **pacb;
361
362     ret = aio_cancel(acb->aiocb.aio_fildes, &acb->aiocb);
363     if (ret == AIO_NOTCANCELED) {
364         /* fail safe: if the aio could not be canceled, we wait for
365            it */
366         while (aio_error(&acb->aiocb) == EINPROGRESS);
367     }
368
369     /* remove the callback from the queue */
370     pacb = &first_aio;
371     for(;;) {
372         if (*pacb == NULL) {
373             break;
374         } else if (*pacb == acb) {
375             *pacb = acb->next;
376             qemu_aio_release(acb);
377             break;
378         }
379         pacb = &acb->next;
380     }
381 }
382
383 static void raw_close(BlockDriverState *bs)
384 {
385     BDRVRawState *s = bs->opaque;
386     if (s->fd >= 0) {
387         close(s->fd);
388         s->fd = -1;
389     }
390 }
391
392 static int raw_truncate(BlockDriverState *bs, int64_t offset)
393 {
394     BDRVRawState *s = bs->opaque;
395     if (s->type != FTYPE_FILE)
396         return -ENOTSUP;
397     if (ftruncate(s->fd, offset) < 0)
398         return -errno;
399     return 0;
400 }
401
402 static int64_t  raw_getlength(BlockDriverState *bs)
403 {
404     BDRVRawState *s = bs->opaque;
405     int fd = s->fd;
406     int64_t size;
407 #ifdef _BSD
408     struct stat sb;
409 #endif
410 #ifdef __sun__
411     struct dk_minfo minfo;
412     int rv;
413 #endif
414     int ret;
415
416     ret = fd_open(bs);
417     if (ret < 0)
418         return ret;
419
420 #ifdef _BSD
421     if (!fstat(fd, &sb) && (S_IFCHR & sb.st_mode)) {
422 #ifdef DIOCGMEDIASIZE
423         if (ioctl(fd, DIOCGMEDIASIZE, (off_t *)&size))
424 #endif
425 #ifdef CONFIG_COCOA
426         size = LONG_LONG_MAX;
427 #else
428         size = lseek(fd, 0LL, SEEK_END);
429 #endif
430     } else
431 #endif
432 #ifdef __sun__
433     /*
434      * use the DKIOCGMEDIAINFO ioctl to read the size.
435      */
436     rv = ioctl ( fd, DKIOCGMEDIAINFO, &minfo );
437     if ( rv != -1 ) {
438         size = minfo.dki_lbsize * minfo.dki_capacity;
439     } else /* there are reports that lseek on some devices
440               fails, but irc discussion said that contingency
441               on contingency was overkill */
442 #endif
443     {
444         size = lseek(fd, 0, SEEK_END);
445     }
446     return size;
447 }
448
449 static int raw_create(const char *filename, int64_t total_size,
450                       const char *backing_file, int flags)
451 {
452     int fd;
453
454     if (flags || backing_file)
455         return -ENOTSUP;
456
457     fd = open(filename, O_WRONLY | O_CREAT | O_TRUNC | O_BINARY, 
458               0644);
459     if (fd < 0)
460         return -EIO;
461     ftruncate(fd, total_size * 512);
462     close(fd);
463     return 0;
464 }
465
466 static void raw_flush(BlockDriverState *bs)
467 {
468     BDRVRawState *s = bs->opaque;
469     fsync(s->fd);
470 }
471
472 BlockDriver bdrv_raw = {
473     "raw",
474     sizeof(BDRVRawState),
475     NULL, /* no probe for protocols */
476     raw_open,
477     NULL,
478     NULL,
479     raw_close,
480     raw_create,
481     raw_flush,
482     
483     .bdrv_aio_read = raw_aio_read,
484     .bdrv_aio_write = raw_aio_write,
485     .bdrv_aio_cancel = raw_aio_cancel,
486     .aiocb_size = sizeof(RawAIOCB),
487     .protocol_name = "file",
488     .bdrv_pread = raw_pread,
489     .bdrv_pwrite = raw_pwrite,
490     .bdrv_truncate = raw_truncate,
491     .bdrv_getlength = raw_getlength,
492 };
493
494 /***********************************************/
495 /* host device */
496
497 #ifdef CONFIG_COCOA
498 static kern_return_t FindEjectableCDMedia( io_iterator_t *mediaIterator );
499 static kern_return_t GetBSDPath( io_iterator_t mediaIterator, char *bsdPath, CFIndex maxPathSize );
500
501 kern_return_t FindEjectableCDMedia( io_iterator_t *mediaIterator )
502 {
503     kern_return_t       kernResult; 
504     mach_port_t     masterPort;
505     CFMutableDictionaryRef  classesToMatch;
506
507     kernResult = IOMasterPort( MACH_PORT_NULL, &masterPort );
508     if ( KERN_SUCCESS != kernResult ) {
509         printf( "IOMasterPort returned %d\n", kernResult );
510     }
511     
512     classesToMatch = IOServiceMatching( kIOCDMediaClass ); 
513     if ( classesToMatch == NULL ) {
514         printf( "IOServiceMatching returned a NULL dictionary.\n" );
515     } else {
516     CFDictionarySetValue( classesToMatch, CFSTR( kIOMediaEjectableKey ), kCFBooleanTrue );
517     }
518     kernResult = IOServiceGetMatchingServices( masterPort, classesToMatch, mediaIterator );
519     if ( KERN_SUCCESS != kernResult )
520     {
521         printf( "IOServiceGetMatchingServices returned %d\n", kernResult );
522     }
523     
524     return kernResult;
525 }
526
527 kern_return_t GetBSDPath( io_iterator_t mediaIterator, char *bsdPath, CFIndex maxPathSize )
528 {
529     io_object_t     nextMedia;
530     kern_return_t   kernResult = KERN_FAILURE;
531     *bsdPath = '\0';
532     nextMedia = IOIteratorNext( mediaIterator );
533     if ( nextMedia )
534     {
535         CFTypeRef   bsdPathAsCFString;
536     bsdPathAsCFString = IORegistryEntryCreateCFProperty( nextMedia, CFSTR( kIOBSDNameKey ), kCFAllocatorDefault, 0 );
537         if ( bsdPathAsCFString ) {
538             size_t devPathLength;
539             strcpy( bsdPath, _PATH_DEV );
540             strcat( bsdPath, "r" );
541             devPathLength = strlen( bsdPath );
542             if ( CFStringGetCString( bsdPathAsCFString, bsdPath + devPathLength, maxPathSize - devPathLength, kCFStringEncodingASCII ) ) {
543                 kernResult = KERN_SUCCESS;
544             }
545             CFRelease( bsdPathAsCFString );
546         }
547         IOObjectRelease( nextMedia );
548     }
549     
550     return kernResult;
551 }
552
553 #endif
554
555 static int hdev_open(BlockDriverState *bs, const char *filename, int flags)
556 {
557     BDRVRawState *s = bs->opaque;
558     int fd, open_flags, ret;
559
560 #ifdef CONFIG_COCOA
561     if (strstart(filename, "/dev/cdrom", NULL)) {
562         kern_return_t kernResult;
563         io_iterator_t mediaIterator;
564         char bsdPath[ MAXPATHLEN ];
565         int fd;
566  
567         kernResult = FindEjectableCDMedia( &mediaIterator );
568         kernResult = GetBSDPath( mediaIterator, bsdPath, sizeof( bsdPath ) );
569     
570         if ( bsdPath[ 0 ] != '\0' ) {
571             strcat(bsdPath,"s0");
572             /* some CDs don't have a partition 0 */
573             fd = open(bsdPath, O_RDONLY | O_BINARY | O_LARGEFILE);
574             if (fd < 0) {
575                 bsdPath[strlen(bsdPath)-1] = '1';
576             } else {
577                 close(fd);
578             }
579             filename = bsdPath;
580         }
581         
582         if ( mediaIterator )
583             IOObjectRelease( mediaIterator );
584     }
585 #endif
586     open_flags = O_BINARY;
587     if ((flags & BDRV_O_ACCESS) == O_RDWR) {
588         open_flags |= O_RDWR;
589     } else {
590         open_flags |= O_RDONLY;
591         bs->read_only = 1;
592     }
593
594     s->type = FTYPE_FILE;
595 #if defined(__linux__)
596     if (strstart(filename, "/dev/cd", NULL)) {
597         /* open will not fail even if no CD is inserted */
598         open_flags |= O_NONBLOCK;
599         s->type = FTYPE_CD;
600     } else if (strstart(filename, "/dev/fd", NULL)) {
601         s->type = FTYPE_FD;
602         s->fd_open_flags = open_flags;
603         /* open will not fail even if no floppy is inserted */
604         open_flags |= O_NONBLOCK;
605     }
606 #endif
607     fd = open(filename, open_flags, 0644);
608     if (fd < 0) {
609         ret = -errno;
610         if (ret == -EROFS)
611             ret = -EACCES;
612         return ret;
613     }
614     s->fd = fd;
615 #if defined(__linux__)
616     /* close fd so that we can reopen it as needed */
617     if (s->type == FTYPE_FD) {
618         close(s->fd);
619         s->fd = -1;
620         s->fd_media_changed = 1;
621     }
622 #endif
623     return 0;
624 }
625
626 #if defined(__linux__) && !defined(QEMU_TOOL)
627
628 /* Note: we do not have a reliable method to detect if the floppy is
629    present. The current method is to try to open the floppy at every
630    I/O and to keep it opened during a few hundreds of ms. */
631 static int fd_open(BlockDriverState *bs)
632 {
633     BDRVRawState *s = bs->opaque;
634     int last_media_present;
635
636     if (s->type != FTYPE_FD)
637         return 0;
638     last_media_present = (s->fd >= 0);
639     if (s->fd >= 0 && 
640         (qemu_get_clock(rt_clock) - s->fd_open_time) >= FD_OPEN_TIMEOUT) {
641         close(s->fd);
642         s->fd = -1;
643 #ifdef DEBUG_FLOPPY
644         printf("Floppy closed\n");
645 #endif
646     }
647     if (s->fd < 0) {
648         if (s->fd_got_error && 
649             (qemu_get_clock(rt_clock) - s->fd_error_time) < FD_OPEN_TIMEOUT) {
650 #ifdef DEBUG_FLOPPY
651             printf("No floppy (open delayed)\n");
652 #endif
653             return -EIO;
654         }
655         s->fd = open(bs->filename, s->fd_open_flags);
656         if (s->fd < 0) {
657             s->fd_error_time = qemu_get_clock(rt_clock);
658             s->fd_got_error = 1;
659             if (last_media_present)
660                 s->fd_media_changed = 1;
661 #ifdef DEBUG_FLOPPY
662             printf("No floppy\n");
663 #endif
664             return -EIO;
665         }
666 #ifdef DEBUG_FLOPPY
667         printf("Floppy opened\n");
668 #endif
669     }
670     if (!last_media_present)
671         s->fd_media_changed = 1;
672     s->fd_open_time = qemu_get_clock(rt_clock);
673     s->fd_got_error = 0;
674     return 0;
675 }
676 #else
677 static int fd_open(BlockDriverState *bs)
678 {
679     return 0;
680 }
681 #endif
682
683 #if defined(__linux__)
684
685 static int raw_is_inserted(BlockDriverState *bs)
686 {
687     BDRVRawState *s = bs->opaque;
688     int ret;
689
690     switch(s->type) {
691     case FTYPE_CD:
692         ret = ioctl(s->fd, CDROM_DRIVE_STATUS, CDSL_CURRENT);
693         if (ret == CDS_DISC_OK)
694             return 1;
695         else
696             return 0;
697         break;
698     case FTYPE_FD:
699         ret = fd_open(bs);
700         return (ret >= 0);
701     default:
702         return 1;
703     }
704 }
705
706 /* currently only used by fdc.c, but a CD version would be good too */
707 static int raw_media_changed(BlockDriverState *bs)
708 {
709     BDRVRawState *s = bs->opaque;
710
711     switch(s->type) {
712     case FTYPE_FD:
713         {
714             int ret;
715             /* XXX: we do not have a true media changed indication. It
716                does not work if the floppy is changed without trying
717                to read it */
718             fd_open(bs);
719             ret = s->fd_media_changed;
720             s->fd_media_changed = 0;
721 #ifdef DEBUG_FLOPPY
722             printf("Floppy changed=%d\n", ret);
723 #endif
724             return ret;
725         }
726     default:
727         return -ENOTSUP;
728     }
729 }
730
731 static int raw_eject(BlockDriverState *bs, int eject_flag)
732 {
733     BDRVRawState *s = bs->opaque;
734
735     switch(s->type) {
736     case FTYPE_CD:
737         if (eject_flag) {
738             if (ioctl (s->fd, CDROMEJECT, NULL) < 0)
739                 perror("CDROMEJECT");
740         } else {
741             if (ioctl (s->fd, CDROMCLOSETRAY, NULL) < 0)
742                 perror("CDROMEJECT");
743         }
744         break;
745     case FTYPE_FD:
746         {
747             int fd;
748             if (s->fd >= 0) {
749                 close(s->fd);
750                 s->fd = -1;
751             }
752             fd = open(bs->filename, s->fd_open_flags | O_NONBLOCK);
753             if (fd >= 0) {
754                 if (ioctl(fd, FDEJECT, 0) < 0)
755                     perror("FDEJECT");
756                 close(fd);
757             }
758         }
759         break;
760     default:
761         return -ENOTSUP;
762     }
763     return 0;
764 }
765
766 static int raw_set_locked(BlockDriverState *bs, int locked)
767 {
768     BDRVRawState *s = bs->opaque;
769
770     switch(s->type) {
771     case FTYPE_CD:
772         if (ioctl (s->fd, CDROM_LOCKDOOR, locked) < 0) {
773             /* Note: an error can happen if the distribution automatically
774                mounts the CD-ROM */
775             //        perror("CDROM_LOCKDOOR");
776         }
777         break;
778     default:
779         return -ENOTSUP;
780     }
781     return 0;
782 }
783
784 #else
785
786 static int raw_is_inserted(BlockDriverState *bs)
787 {
788     return 1;
789 }
790
791 static int raw_media_changed(BlockDriverState *bs)
792 {
793     return -ENOTSUP;
794 }
795
796 static int raw_eject(BlockDriverState *bs, int eject_flag)
797 {
798     return -ENOTSUP;
799 }
800
801 static int raw_set_locked(BlockDriverState *bs, int locked)
802 {
803     return -ENOTSUP;
804 }
805
806 #endif /* !linux */
807
808 BlockDriver bdrv_host_device = {
809     "host_device",
810     sizeof(BDRVRawState),
811     NULL, /* no probe for protocols */
812     hdev_open,
813     NULL,
814     NULL,
815     raw_close,
816     NULL,
817     raw_flush,
818     
819     .bdrv_aio_read = raw_aio_read,
820     .bdrv_aio_write = raw_aio_write,
821     .bdrv_aio_cancel = raw_aio_cancel,
822     .aiocb_size = sizeof(RawAIOCB),
823     .bdrv_pread = raw_pread,
824     .bdrv_pwrite = raw_pwrite,
825     .bdrv_getlength = raw_getlength,
826
827     /* removable device support */
828     .bdrv_is_inserted = raw_is_inserted,
829     .bdrv_media_changed = raw_media_changed,
830     .bdrv_eject = raw_eject,
831     .bdrv_set_locked = raw_set_locked,
832 };
833
834 #else /* _WIN32 */
835
836 /* XXX: use another file ? */
837 #include <winioctl.h>
838
839 #define FTYPE_FILE 0
840 #define FTYPE_CD     1
841 #define FTYPE_HARDDISK 2
842
843 typedef struct BDRVRawState {
844     HANDLE hfile;
845     int type;
846     char drive_path[16]; /* format: "d:\" */
847 } BDRVRawState;
848
849 typedef struct RawAIOCB {
850     BlockDriverAIOCB common;
851     HANDLE hEvent;
852     OVERLAPPED ov;
853     int count;
854 } RawAIOCB;
855
856 int qemu_ftruncate64(int fd, int64_t length)
857 {
858     LARGE_INTEGER li;
859     LONG high;
860     HANDLE h;
861     BOOL res;
862
863     if ((GetVersion() & 0x80000000UL) && (length >> 32) != 0)
864         return -1;
865
866     h = (HANDLE)_get_osfhandle(fd);
867
868     /* get current position, ftruncate do not change position */
869     li.HighPart = 0;
870     li.LowPart = SetFilePointer (h, 0, &li.HighPart, FILE_CURRENT);
871     if (li.LowPart == 0xffffffffUL && GetLastError() != NO_ERROR)
872         return -1;
873
874     high = length >> 32;
875     if (!SetFilePointer(h, (DWORD) length, &high, FILE_BEGIN))
876         return -1;
877     res = SetEndOfFile(h);
878
879     /* back to old position */
880     SetFilePointer(h, li.LowPart, &li.HighPart, FILE_BEGIN);
881     return res ? 0 : -1;
882 }
883
884 static int set_sparse(int fd)
885 {
886     DWORD returned;
887     return (int) DeviceIoControl((HANDLE)_get_osfhandle(fd), FSCTL_SET_SPARSE,
888                                  NULL, 0, NULL, 0, &returned, NULL);
889 }
890
891 static int raw_open(BlockDriverState *bs, const char *filename, int flags)
892 {
893     BDRVRawState *s = bs->opaque;
894     int access_flags, create_flags;
895     DWORD overlapped;
896
897     s->type = FTYPE_FILE;
898
899     if ((flags & BDRV_O_ACCESS) == O_RDWR) {
900         access_flags = GENERIC_READ | GENERIC_WRITE;
901     } else {
902         access_flags = GENERIC_READ;
903     }
904     if (flags & BDRV_O_CREAT) {
905         create_flags = CREATE_ALWAYS;
906     } else {
907         create_flags = OPEN_EXISTING;
908     }
909 #ifdef QEMU_TOOL
910     overlapped = FILE_ATTRIBUTE_NORMAL;
911 #else
912     overlapped = FILE_FLAG_OVERLAPPED;
913 #endif
914     s->hfile = CreateFile(filename, access_flags, 
915                           FILE_SHARE_READ, NULL,
916                           create_flags, overlapped, NULL);
917     if (s->hfile == INVALID_HANDLE_VALUE) 
918         return -1;
919     return 0;
920 }
921
922 static int raw_pread(BlockDriverState *bs, int64_t offset, 
923                      uint8_t *buf, int count)
924 {
925     BDRVRawState *s = bs->opaque;
926     OVERLAPPED ov;
927     DWORD ret_count;
928     int ret;
929     
930     memset(&ov, 0, sizeof(ov));
931     ov.Offset = offset;
932     ov.OffsetHigh = offset >> 32;
933     ret = ReadFile(s->hfile, buf, count, &ret_count, &ov);
934     if (!ret) {
935         ret = GetOverlappedResult(s->hfile, &ov, &ret_count, TRUE);
936         if (!ret)
937             return -EIO;
938         else
939             return ret_count;
940     }
941     return ret_count;
942 }
943
944 static int raw_pwrite(BlockDriverState *bs, int64_t offset, 
945                       const uint8_t *buf, int count)
946 {
947     BDRVRawState *s = bs->opaque;
948     OVERLAPPED ov;
949     DWORD ret_count;
950     int ret;
951     
952     memset(&ov, 0, sizeof(ov));
953     ov.Offset = offset;
954     ov.OffsetHigh = offset >> 32;
955     ret = WriteFile(s->hfile, buf, count, &ret_count, &ov);
956     if (!ret) {
957         ret = GetOverlappedResult(s->hfile, &ov, &ret_count, TRUE);
958         if (!ret)
959             return -EIO;
960         else
961             return ret_count;
962     }
963     return ret_count;
964 }
965
966 #if 0
967 #ifndef QEMU_TOOL
968 static void raw_aio_cb(void *opaque)
969 {
970     RawAIOCB *acb = opaque;
971     BlockDriverState *bs = acb->common.bs;
972     BDRVRawState *s = bs->opaque;
973     DWORD ret_count;
974     int ret;
975
976     ret = GetOverlappedResult(s->hfile, &acb->ov, &ret_count, TRUE);
977     if (!ret || ret_count != acb->count) {
978         acb->common.cb(acb->common.opaque, -EIO);
979     } else {
980         acb->common.cb(acb->common.opaque, 0);
981     }
982 }
983 #endif
984
985 static RawAIOCB *raw_aio_setup(BlockDriverState *bs,
986         int64_t sector_num, uint8_t *buf, int nb_sectors,
987         BlockDriverCompletionFunc *cb, void *opaque)
988 {
989     RawAIOCB *acb;
990     int64_t offset;
991
992     acb = qemu_aio_get(bs, cb, opaque);
993     if (acb->hEvent) {
994         acb->hEvent = CreateEvent(NULL, TRUE, FALSE, NULL);
995         if (!acb->hEvent) {
996             qemu_aio_release(acb);
997             return NULL;
998         }
999     }
1000     memset(&acb->ov, 0, sizeof(acb->ov));
1001     offset = sector_num * 512;
1002     acb->ov.Offset = offset;
1003     acb->ov.OffsetHigh = offset >> 32;
1004     acb->ov.hEvent = acb->hEvent;
1005     acb->count = nb_sectors * 512;
1006 #ifndef QEMU_TOOL
1007     qemu_add_wait_object(acb->ov.hEvent, raw_aio_cb, acb);
1008 #endif
1009     return acb;
1010 }
1011
1012 static BlockDriverAIOCB *raw_aio_read(BlockDriverState *bs,
1013         int64_t sector_num, uint8_t *buf, int nb_sectors,
1014         BlockDriverCompletionFunc *cb, void *opaque)
1015 {
1016     BDRVRawState *s = bs->opaque;
1017     RawAIOCB *acb;
1018     int ret;
1019
1020     acb = raw_aio_setup(bs, sector_num, buf, nb_sectors, cb, opaque);
1021     if (!acb)
1022         return NULL;
1023     ret = ReadFile(s->hfile, buf, acb->count, NULL, &acb->ov);
1024     if (!ret) {
1025         qemu_aio_release(acb);
1026         return NULL;
1027     }
1028 #ifdef QEMU_TOOL
1029     qemu_aio_release(acb);
1030 #endif
1031     return (BlockDriverAIOCB *)acb;
1032 }
1033
1034 static BlockDriverAIOCB *raw_aio_write(BlockDriverState *bs,
1035         int64_t sector_num, uint8_t *buf, int nb_sectors,
1036         BlockDriverCompletionFunc *cb, void *opaque)
1037 {
1038     BDRVRawState *s = bs->opaque;
1039     RawAIOCB *acb;
1040     int ret;
1041
1042     acb = raw_aio_setup(bs, sector_num, buf, nb_sectors, cb, opaque);
1043     if (!acb)
1044         return NULL;
1045     ret = WriteFile(s->hfile, buf, acb->count, NULL, &acb->ov);
1046     if (!ret) {
1047         qemu_aio_release(acb);
1048         return NULL;
1049     }
1050 #ifdef QEMU_TOOL
1051     qemu_aio_release(acb);
1052 #endif
1053     return (BlockDriverAIOCB *)acb;
1054 }
1055
1056 static void raw_aio_cancel(BlockDriverAIOCB *blockacb)
1057 {
1058 #ifndef QEMU_TOOL
1059     RawAIOCB *acb = (RawAIOCB *)blockacb;
1060     BlockDriverState *bs = acb->common.bs;
1061     BDRVRawState *s = bs->opaque;
1062
1063     qemu_del_wait_object(acb->ov.hEvent, raw_aio_cb, acb);
1064     /* XXX: if more than one async I/O it is not correct */
1065     CancelIo(s->hfile);
1066     qemu_aio_release(acb);
1067 #endif
1068 }
1069 #endif /* #if 0 */
1070
1071 static void raw_flush(BlockDriverState *bs)
1072 {
1073     BDRVRawState *s = bs->opaque;
1074     FlushFileBuffers(s->hfile);
1075 }
1076
1077 static void raw_close(BlockDriverState *bs)
1078 {
1079     BDRVRawState *s = bs->opaque;
1080     CloseHandle(s->hfile);
1081 }
1082
1083 static int raw_truncate(BlockDriverState *bs, int64_t offset)
1084 {
1085     BDRVRawState *s = bs->opaque;
1086     DWORD low, high;
1087
1088     low = offset;
1089     high = offset >> 32;
1090     if (!SetFilePointer(s->hfile, low, &high, FILE_BEGIN))
1091         return -EIO;
1092     if (!SetEndOfFile(s->hfile))
1093         return -EIO;
1094     return 0;
1095 }
1096
1097 static int64_t raw_getlength(BlockDriverState *bs)
1098 {
1099     BDRVRawState *s = bs->opaque;
1100     LARGE_INTEGER l;
1101     ULARGE_INTEGER available, total, total_free; 
1102     DISK_GEOMETRY dg;
1103     DWORD count;
1104     BOOL status;
1105
1106     switch(s->type) {
1107     case FTYPE_FILE:
1108         l.LowPart = GetFileSize(s->hfile, &l.HighPart);
1109         if (l.LowPart == 0xffffffffUL && GetLastError() != NO_ERROR)
1110             return -EIO;
1111         break;
1112     case FTYPE_CD:
1113         if (!GetDiskFreeSpaceEx(s->drive_path, &available, &total, &total_free))
1114             return -EIO;
1115         l.QuadPart = total.QuadPart;
1116         break;
1117     case FTYPE_HARDDISK:
1118         status = DeviceIoControl(s->hfile, IOCTL_DISK_GET_DRIVE_GEOMETRY,
1119                                  NULL, 0, &dg, sizeof(dg), &count, NULL);
1120         if (status != FALSE) {
1121             l.QuadPart = dg.Cylinders.QuadPart * dg.TracksPerCylinder
1122                 * dg.SectorsPerTrack * dg.BytesPerSector;
1123         }
1124         break;
1125     default:
1126         return -EIO;
1127     }
1128     return l.QuadPart;
1129 }
1130
1131 static int raw_create(const char *filename, int64_t total_size,
1132                       const char *backing_file, int flags)
1133 {
1134     int fd;
1135
1136     if (flags || backing_file)
1137         return -ENOTSUP;
1138
1139     fd = open(filename, O_WRONLY | O_CREAT | O_TRUNC | O_BINARY, 
1140               0644);
1141     if (fd < 0)
1142         return -EIO;
1143     set_sparse(fd);
1144     ftruncate(fd, total_size * 512);
1145     close(fd);
1146     return 0;
1147 }
1148
1149 void qemu_aio_init(void)
1150 {
1151 }
1152
1153 void qemu_aio_poll(void)
1154 {
1155 }
1156
1157 void qemu_aio_flush(void)
1158 {
1159 }
1160
1161 void qemu_aio_wait_start(void)
1162 {
1163 }
1164
1165 void qemu_aio_wait(void)
1166 {
1167 #ifndef QEMU_TOOL
1168     qemu_bh_poll();
1169 #endif
1170 }
1171
1172 void qemu_aio_wait_end(void)
1173 {
1174 }
1175
1176 BlockDriver bdrv_raw = {
1177     "raw",
1178     sizeof(BDRVRawState),
1179     NULL, /* no probe for protocols */
1180     raw_open,
1181     NULL,
1182     NULL,
1183     raw_close,
1184     raw_create,
1185     raw_flush,
1186     
1187 #if 0
1188     .bdrv_aio_read = raw_aio_read,
1189     .bdrv_aio_write = raw_aio_write,
1190     .bdrv_aio_cancel = raw_aio_cancel,
1191     .aiocb_size = sizeof(RawAIOCB);
1192 #endif
1193     .protocol_name = "file",
1194     .bdrv_pread = raw_pread,
1195     .bdrv_pwrite = raw_pwrite,
1196     .bdrv_truncate = raw_truncate,
1197     .bdrv_getlength = raw_getlength,
1198 };
1199
1200 /***********************************************/
1201 /* host device */
1202
1203 static int find_cdrom(char *cdrom_name, int cdrom_name_size)
1204 {
1205     char drives[256], *pdrv = drives;
1206     UINT type;
1207
1208     memset(drives, 0, sizeof(drives));
1209     GetLogicalDriveStrings(sizeof(drives), drives);
1210     while(pdrv[0] != '\0') {
1211         type = GetDriveType(pdrv);
1212         switch(type) {
1213         case DRIVE_CDROM:
1214             snprintf(cdrom_name, cdrom_name_size, "\\\\.\\%c:", pdrv[0]);
1215             return 0;
1216             break;
1217         }
1218         pdrv += lstrlen(pdrv) + 1;
1219     }
1220     return -1;
1221 }
1222
1223 static int find_device_type(BlockDriverState *bs, const char *filename)
1224 {
1225     BDRVRawState *s = bs->opaque;
1226     UINT type;
1227     const char *p;
1228
1229     if (strstart(filename, "\\\\.\\", &p) ||
1230         strstart(filename, "//./", &p)) {
1231         if (stristart(p, "PhysicalDrive", NULL))
1232             return FTYPE_HARDDISK;
1233         snprintf(s->drive_path, sizeof(s->drive_path), "%c:\\", p[0]);
1234         type = GetDriveType(s->drive_path);
1235         if (type == DRIVE_CDROM)
1236             return FTYPE_CD;
1237         else
1238             return FTYPE_FILE;
1239     } else {
1240         return FTYPE_FILE;
1241     }
1242 }
1243
1244 static int hdev_open(BlockDriverState *bs, const char *filename, int flags)
1245 {
1246     BDRVRawState *s = bs->opaque;
1247     int access_flags, create_flags;
1248     DWORD overlapped;
1249     char device_name[64];
1250
1251     if (strstart(filename, "/dev/cdrom", NULL)) {
1252         if (find_cdrom(device_name, sizeof(device_name)) < 0)
1253             return -ENOENT;
1254         filename = device_name;
1255     } else {
1256         /* transform drive letters into device name */
1257         if (((filename[0] >= 'a' && filename[0] <= 'z') ||
1258              (filename[0] >= 'A' && filename[0] <= 'Z')) &&
1259             filename[1] == ':' && filename[2] == '\0') {
1260             snprintf(device_name, sizeof(device_name), "\\\\.\\%c:", filename[0]);
1261             filename = device_name;
1262         }
1263     }
1264     s->type = find_device_type(bs, filename);
1265     
1266     if ((flags & BDRV_O_ACCESS) == O_RDWR) {
1267         access_flags = GENERIC_READ | GENERIC_WRITE;
1268     } else {
1269         access_flags = GENERIC_READ;
1270     }
1271     create_flags = OPEN_EXISTING;
1272
1273 #ifdef QEMU_TOOL
1274     overlapped = FILE_ATTRIBUTE_NORMAL;
1275 #else
1276     overlapped = FILE_FLAG_OVERLAPPED;
1277 #endif
1278     s->hfile = CreateFile(filename, access_flags, 
1279                           FILE_SHARE_READ, NULL,
1280                           create_flags, overlapped, NULL);
1281     if (s->hfile == INVALID_HANDLE_VALUE) 
1282         return -1;
1283     return 0;
1284 }
1285
1286 #if 0
1287 /***********************************************/
1288 /* removable device additionnal commands */
1289
1290 static int raw_is_inserted(BlockDriverState *bs)
1291 {
1292     return 1;
1293 }
1294
1295 static int raw_media_changed(BlockDriverState *bs)
1296 {
1297     return -ENOTSUP;
1298 }
1299
1300 static int raw_eject(BlockDriverState *bs, int eject_flag)
1301 {
1302     DWORD ret_count;
1303
1304     if (s->type == FTYPE_FILE)
1305         return -ENOTSUP;
1306     if (eject_flag) {
1307         DeviceIoControl(s->hfile, IOCTL_STORAGE_EJECT_MEDIA, 
1308                         NULL, 0, NULL, 0, &lpBytesReturned, NULL);
1309     } else {
1310         DeviceIoControl(s->hfile, IOCTL_STORAGE_LOAD_MEDIA, 
1311                         NULL, 0, NULL, 0, &lpBytesReturned, NULL);
1312     }
1313 }
1314
1315 static int raw_set_locked(BlockDriverState *bs, int locked)
1316 {
1317     return -ENOTSUP;
1318 }
1319 #endif
1320
1321 BlockDriver bdrv_host_device = {
1322     "host_device",
1323     sizeof(BDRVRawState),
1324     NULL, /* no probe for protocols */
1325     hdev_open,
1326     NULL,
1327     NULL,
1328     raw_close,
1329     NULL,
1330     raw_flush,
1331     
1332 #if 0
1333     .bdrv_aio_read = raw_aio_read,
1334     .bdrv_aio_write = raw_aio_write,
1335     .bdrv_aio_cancel = raw_aio_cancel,
1336     .aiocb_size = sizeof(RawAIOCB);
1337 #endif
1338     .bdrv_pread = raw_pread,
1339     .bdrv_pwrite = raw_pwrite,
1340     .bdrv_getlength = raw_getlength,
1341 };
1342 #endif /* _WIN32 */